5 kỹ năng xử lý sẽ tiết lộ tuổi của bất kỳ trang web nào

Thông thường, một bài báo hoặc trang web được xuất bản ở trên màn hình trước mặt bạn. Nhưng đôi khi một trang sẽ cố gắng hóa trang thành một kỳ quan không tuổi, điều này có vấn đề khi bạn cần biết liệu nó có còn phù hợp hay không. Đừng băn khoăn: Có nhiều cách để vén bức màn bí ẩn.

Nói rõ hơn, việc khai quật một ngày chính xác không được đảm bảo — bạn chỉ có thể đưa ra ước tính về độ cũ của thông tin. Thường thì như vậy là đủ tốt rồi.

archive.org/web/

Dễ nhất: Nhìn vào URL

Về mặt kỹ thuật, địa chỉ của trang là “trên màn hình trước mặt bạn”, nhưng rất dễ bị bỏ sót. Kiểm tra ở đó trước. Thật không may, những điều này không phải lúc nào cũng nhất quán hoặc chính xác. Một số bài báo cũ hơn của Khoa học Phổ thông có URL bao gồm năm và tháng (nhưng không phải ngày) chúng được xuất bản. Những câu chuyện mới hơn của chúng tôi thì không.

Dễ dàng: Điều tra sơ đồ trang web XML

Sơ đồ trang XML chỉ đơn giản là một danh sách các URL cho một trang web nhất định, với thông tin cơ bản về từng URL. Nó ở đó để hướng dẫn các trình thu thập dữ liệu của công cụ tìm kiếm trong nhiệm vụ không bao giờ kết thúc của họ để thu thập dữ liệu. Để xem nó, hãy vào thanh địa chỉ và thêm /sitemap.xml vào cuối URL của trang.

Nếu bạn may mắn, nó sẽ được tổ chức tốt, giống như trang web của Nhà Trắng . Đối với các trang web được cập nhật thường xuyên hơn, như Lifehacker , bạn có thể nhận được một danh sách lớn các ngày được sửa đổi lần cuối. Trường hợp xấu nhất, nó sẽ không hoạt động chút nào và bạn sẽ gặp lỗi 404.

Sử dụng https://archive.org/web/

https://archive.org/web/ của Internet Archive là một kho lưu trữ các ảnh chụp nhanh lập danh mục hàng tỷ trang trên web. Chỉ cần dán URL bạn muốn điều tra vào thanh tìm kiếm của trang web và nhấn Enter . Thao tác này sẽ trả về dòng thời gian hiển thị khi công cụ chụp được hình ảnh của trang được đề cập. Nhấp vào năm bạn muốn, sau đó nhấp vào một trong các ngày lịch được đánh dấu để xem nó trông như thế nào vào thời điểm đó.

Quảng cáo

Khó hơn: Khai thác các chức năng tìm kiếm nâng cao của Google

Đôi khi kết quả của Google đi kèm với ngày tháng. Nếu không, bạn có thể bắt tay công cụ tìm kiếm. Sao chép địa chỉ của trang web mà bạn muốn biết về, người đứng đầu vào thanh tìm kiếm, và gõ inurl: . Sau đó, dán URL sau dấu hai chấm (không có dấu cách). Điều này sẽ yêu cầu Google chỉ hiển thị cho bạn kết quả từ trang web chính xác đó.

Tiếp theo, chuyển đến thanh địa chỉ (không phải thanh tìm kiếm) và thêm & as_qdr = y25 vào cuối URL trong đó. Lệnh này yêu cầu Google hiển thị cho bạn kết quả trong 25 năm qua. Để chia nhỏ hơn một chút, “as” là viết tắt của “tìm kiếm nâng cao”, “qdr” là viết tắt của “phạm vi ngày truy vấn” và “y25” có nghĩa là “25 năm qua”. Bạn có thể thay đổi bit cuối cùng đó để sử dụng “d” cho ngày, “w” cho tuần hoặc “m” cho tháng, theo sau là bất kỳ số nào bạn muốn.

Khi bạn nhấn Enter trên URL đã sửa đổi đó, Google sẽ hiển thị ngày cùng với kết quả tìm kiếm của bạn. Nhưng giống như các tùy chọn khác được liệt kê ở đây, không có gì đảm bảo rằng điều này chính xác đến mức nào. Nó có thể là ngày xuất bản, ngày nó được sửa đổi lần cuối hoặc khi Google lập chỉ mục nó.

Một cách khác tốn nhiều thời gian hơn để hoàn thiện lần xuất hiện đầu tiên trên Google của trang là sử dụng lệnh inurl:, tìm Công cụ dưới thanh tìm kiếm và nhấp vào menu thả xuống Bất kỳ lúc nào . Chọn Phạm vi tùy chỉnh… và cắm một số ngày. Bằng cách tìm kiếm theo từng năm và liên tục thu hẹp phạm vi ngày của mình, bạn sẽ có thể tìm thấy thời điểm một trang hoạt động lần đầu tiên, nhưng đây không phải là một quy trình hiệu quả.

Khó nhất: Đào sâu vào mã nguồn

Nhấp chuột phải vào bất kỳ trang web nào và bạn sẽ thấy một tùy chọn để xem mã nguồn. Trên Google Chrome, nó xuất hiện dưới dạng Xem nguồn trang . Chọn nó, và bạn sẽ có cái nhìn sau bức màn. Bị chôn vùi trong tất cả thông tin đó, bạn có thể tìm thấy khi trang được tạo hoặc sửa đổi. Sử dụng Ctrl + F trên Windows hoặc Cmd + F trên macOS để mở chức năng tìm kiếm và cố gắng hết sức để theo dõi nó. Hãy thử tìm các từ khóa như “ngày tháng”, “ngày xuất bản”, “ngày xuất bản”, “đã sửa đổi”, “ngày sửa đổi” hoặc từ khóa nào đó tương tự.

Saohaivuong.com nói rõ về thời điểm các câu chuyện của mình được xuất bản và cập nhật, nhưng bạn có thể tìm thấy ngày đó trong mã nguồn bằng cách tìm kiếm “last_updated_date”. Tuy nhiên, hãy cẩn thận: Có thể có ngày cho các mục khác trên trang, như ảnh. Đây có thể không cùng độ tuổi với phần còn lại của nội dung.

Sự không nhất quán tuyệt đối và tiềm năng phức tạp là những gì khiến chiến lược này trở thành chiến lược khó nhất trong danh sách của chúng tôi. Nếu nó hoạt động tốt, bạn có thể tìm thấy câu trả lời của mình một cách nhanh chóng. Nếu không, bạn có rất nhiều mã để sàng lọc.

Quảng cáo

Quảng cáo
Chia sẻ suy nghĩ, quan điểm của bạn

Leave a reply

Tìm kiếm

Copyright Saohaivuong All Rights Reserved.

Sao Hải Vương
Logo