Mặt tối của web

Hình ảnh 1 trong sốhai

Khi Google lập chỉ mục hàng tỷ trang web đến nỗi nó thậm chí không thèm liệt kê số lượng nữa, thật khó để tưởng tượng rằng điều đó nằm ngoài những xúc tu sâu rộng của nó.

Tuy nhiên, bên dưới là một thế giới trực tuyến mà ít người biết đang tồn tại. Đó là một khu vực chứa trữ lượng thông tin có giá trị khổng lồ, chưa được khai thác có chứa nhiều cơ sở dữ liệu, các trang web ẩn và các diễn đàn âm u. Đó là một thế giới mà các học giả và nhà nghiên cứu có thể tìm thấy dữ liệu cần thiết để giải quyết một số vấn đề lớn nhất của nhân loại, nhưng cũng là nơi các tổ chức tội phạm hoạt động và các sổ tay khủng bố và nội dung khiêu dâm trẻ em được phân phối miễn phí.

tải ảnh lên icloud từ pc

Biến mất trong dark web

Có nhiều lý do hợp lệ khiến bạn có thể không muốn các nội dung khai thác trực tuyến của mình có thể tìm kiếm được. Tìm hiểu cách bạn có thể biến mất khỏi web

Đồng thời, web ngầm là hy vọng tốt nhất cho những ai muốn thoát khỏi ràng buộc của sự kiểm duyệt của nhà nước độc tài, và chia sẻ ý tưởng hoặc kinh nghiệm của họ với thế giới bên ngoài.

Thú vị? Bạn không cô đơn. Deep web và darknet của nó là một chiến trường mới cho những người muốn bảo vệ quyền riêng tư trực tuyến và những người cảm thấy rằng quyền đó cần phải hy sinh vì sự an toàn của xã hội. Deep web cũng là biên giới mới cho những ai muốn cạnh tranh với Google trong lĩnh vực tìm kiếm. Hãy cùng chúng tôi đi đến phía bên kia của Internet.

Deep web, dark web và darknet

Điều đầu tiên cần hiểu là, trong khi các yếu tố tạo nên trang web khác này có các khía cạnh chung, chúng ta không nói về một thực thể thống nhất, duy nhất. Những người quen biết sẽ thường nói về web sâu hoặc web vô hình, darknet và dark web, và bạn có thể nghĩ rằng tất cả đều giống nhau. Trên thực tế, chúng là những hiện tượng riêng biệt, mặc dù được liên kết bởi các chủ đề, thuộc tính hoặc sở thích chung.

Deep web không lạ lùng hay nham hiểm như người ta vẫn tưởng. Trong khoa học máy tính nói, nó đề cập đến những phần của web, vì bất kỳ lý do gì, đã không thể nhìn thấy đối với các công cụ tìm kiếm thông thường như Google.

Phần lớn web sâu này được tạo thành từ các trang được tạo động và các mục nhập cơ sở dữ liệu chỉ có thể truy cập được thông qua hoàn thành thủ công biểu mẫu HTML

Phần lớn web sâu này được tạo thành từ các trang được tạo động và các mục nhập cơ sở dữ liệu chỉ có thể truy cập được thông qua việc điền thủ công biểu mẫu HTML. Một tỷ lệ nhỏ hơn đã vô tình hoặc cố ý khiến trình thu thập thông tin của Google không thể truy cập được, trong khi các khu vực khác nằm sau các trang web chỉ đăng ký hoặc được bảo vệ bằng mật khẩu.

Đừng nhầm lẫn, web sâu rất lớn. Nghiên cứu tiên phong năm 2001 của Michael Bergman, The Deep Web: Surfacing Hidden Value, ước tính rằng nó chiếm 7.500TB dữ liệu tại thời điểm mà các công cụ tìm kiếm chỉ có thể lập chỉ mục 19.

Ngay cả những ước tính thận trọng hơn trong một bài báo năm 2007 được viết bởi Jayant Madhavan, Alon Halevy và các đồng nghiệp của Google, cho thấy rằng có hơn 25 triệu nguồn nội dung web sâu khác nhau, nhiều trong số đó là những kho lưu trữ khổng lồ.

Có một cảm giác phổ biến trong cộng đồng cơ sở dữ liệu rằng chúng tôi đã bỏ lỡ con thuyền với WWW, bài báo của Google kết luận. Thông điệp xuyên suốt của bài báo này là con thuyền thứ hai đang ở đây, với khối lượng dữ liệu có cấu trúc đáng kinh ngạc, và con thuyền đó nên là của chúng ta.

Kho báu của vực sâu

Tiến sĩ Juliana Freire, người đứng đầu một dự án của Đại học Utah, DeepPeep, cho biết, có rất nhiều nội dung hợp pháp và có giá trị trong deep web, cho biết.

Ví dụ, có một số bộ dữ liệu khoa học (chẳng hạn như Khảo sát Bầu trời Kỹ thuật số Sloan và Trung tâm Quan sát & Dự đoán Lề ven biển), tài liệu và cơ sở dữ liệu, và những bộ này hữu ích cho xã hội và có nhiều ứng dụng quan trọng.

Trang tiếp theo