Bộ Thông tin và Truyền thông MINISTRY OF INFORMATION AND COMMUNICATIONS

4 rủi ro an ninh mạng của web 3.0

Ở thời điểm hiện tại, nhiều người cho rằng Internet giống như ngành công nghiệp ô tô vào đầu thế kỷ XX và cần có những cải tiến lớn. Hãy tưởng tượng một loại Internet không chỉ làm theo chỉ dẫn mà còn giải thích và hiểu mọi thứ truyền tải đến nó thông qua văn bản hoặc lời nói, đồng thời cung cấp các kết quả phù hợp với người sử dụng. Những cải tiến và được áp dụng công nghệ AI này được gọi là thế hệ Web 3.0. Tuy nhiên, bên cạnh sự phát triển đem lại nhiều lợi ích của Web 3.0 thì song hành cùng nó cũng tồn tại những rủi ro và nguy cơ về an toàn, bảo mật thông tin mà người dùng cần tìm hiểu và có những kiến thức để phòng tránh. Bài báo sau đây sẽ giúp người dùng hiểu rõ hơn những lợi ích cũng như mối nguy hiểm tiềm ẩn của thế hệ Web 3.0 này.

KHÁI NIỆM VỀ WEB 3.0

Khi Internet phát triển, xu hướng phát triển là “phi tập trung hóa” web. Thế hệ Web 3.0 chỉ hệ thống web phi tập trung được xây dựng dựa trên công nghệ chuỗi khối (blockchain) với những cải tiến nhằm giải quyết các hạn chế của thế hệ web trước đó.

Theo Tim Berners-Lee (người phát minh ra Web 1.0), Web 1.0 được coi là “web chỉ đọc”, chỉ cho phép người dùng tìm kiếm thông tin và đọc nó. Sự thiếu tương tác tích cực của người dùng phổ thông đối với trang web đã dẫn đến sự ra đời của Web 2.0 hay còn gọi là web “đọc-ghi”, cho phép người dùng kể cả những người không chuyên về kỹ thuật có khả năng đóng góp nội dung cho trang web và tương tác với những người dùng web khác [1]. Web 3.0 đề cập đến các dịch vụ dựa trên Internet được gọi là “Web thông minh”, chẳng hạn như các dịch vụ tìm kiếm ngôn ngữ tự nhiên, khai phá dữ liệu, học máy và công nghệ trí tuệ nhân tạo...[2]. Thuật ngữ Web 3.0 theo Tim Berners-Lee có nghĩa là một trang web dựa trên dữ liệu không chỉ con người mà cả máy móc đều có thể xử lý. Nếu Web 1.0 tạo ra một bộ bách khoa toàn thư, thì Web 2.0 là Wikipedia và Web 3.0 sẽ biến mọi thứ trên web thành một cơ sở dữ liệu khổng lồ. Vậy làm thế nào để Web 3.0 có thể được triển khai và quản lý một cách an toàn. Câu trả lời là dựa vào trí tuệ nhân tạo (AI).

AI khai thác xử lý dữ liệu và hứa hẹn của Web 3.0 là biến tất cả trang web thành dữ liệu tương thích với các công nghệ AI. Điều đó sẽ cung cấp một tập dữ liệu AI khổng lồ, hầu hết trong số đó hiện không thể truy cập được là “dữ liệu phi cấu trúc”. Kết quả có thể là một hàm bước (trong toán học, một hàm số trên tập số thực được gọi là hàm bước hay hàm bậc thang nếu nó có thể được viết dưới dạng một tổ hợp tuyến tính hữu hạn của các hàm đặc trưng trên một số khoảng) trong khả năng AI.

Đó không hoàn toàn là định nghĩa lại của Web 3.0. Những gì Tim Berners-Lee mô tả là một trang web với ý nghĩa vốn có, liên quan đến cách dữ liệu có thể được sử dụng. Định nghĩa mới về web phi tập trung liên quan đến cách dữ liệu được thêm vào. Web 3.0 là một nền tảng trong đó bất kỳ ai cũng có thể thêm nội dung mà không cần sự kiểm soát của những người gác cổng tập trung và nội dung có ý nghĩa mà cả con người và máy móc đều có thể hiểu được.

Theo Nova Spivack, Giám đốc điều hành của Radar Networks, Web 3.0 là thế hệ thứ ba của web được kích hoạt bởi sự kết hợp của nhiều công nghệ mới nổi khác nhau như [2]:

- Chuyển đổi web từ một mạng các ứng dụng và kho nội dung riêng biệt thành một mạng liền mạch và có thể tương tác.

- Khả năng kết nối phổ biến, sử dụng mạng băng thông rộng và truy cập Internet thông qua các thiết bị di động.

- Điện toán mạng, các mô hình kinh doanh SaaS, khả năng tương tác của các dịch vụ web, điện toán phân tán, điện toán lưới và điện toán đám mây.

- Công nghệ mở, API và giao thức mở, định dạng dữ liệu mở, nền tảng phần mềm nguồn mở và dữ liệu mở.

- Định danh mở, danh tiếng mở, định danh di động và dữ liệu cá nhân.

- Web thông minh, các công nghệ web dựa trên ngữ nghĩa, chẳng hạn như Khung mô tả tài nguyên (RDF), Ngôn ngữ bản thể học web (OWL), Ngôn ngữ quy tắc web dựa trên ngữ nghĩa (SWRL), Giao thức SPARQL và Ngôn ngữ truy vấn RDF (SPARQL), Mô tả tài nguyên thu thập từ các phương ngữ của ngôn ngữ (GRDDL), các nền tảng ứng dụng dựa trên ngữ nghĩa và kho dữ liệu dựa trên câu lệnh.

- Cơ sở dữ liệu phân tán, cơ sở dữ liệu toàn cầu.

- Các ứng dụng thông minh, xử lý ngôn ngữ tự nhiên, học máy và các tác nhân tự quản...

RỦI RO ĐỐI VỚI KHÔNG GIAN MẠNG CỦA WEB 3.0

Mặc dù tầm nhìn về Web 3.0 mang lại nhiều cơ hội để phát triển, nhưng nó lại gây ra những lo ngại về an toàn và bảo mật. Web 3.0 nếu không được hiểu và sử dụng đúng có thể gây ra rủi ro an toàn mạng vì một số lý do dưới đây:

Chất lượng thông tin

Web 1.0 dựa vào danh tiếng của các nhà xuất bản để đảm bảo độ chính xác. Web 2.0 làm giảm chất lượng dữ liệu, dẫn đến thông tin sai lệch trên web. Có nhiều vấn đề đặt ra rằng, liệu sự đồng thuận chấp nhận dữ liệu do máy quản lý trong Web 3.0 có bao gồm kiểm tra độ chính xác không hay ai sẽ đưa ra quyết định, trình độ của họ như thế nào và điều gì thúc đẩy họ dựa trên thực tế thay vì để quảng cáo cho một bên nào đó.

Thao tác dữ liệu

Thao tác dữ liệu có chủ đích sẽ được sử dụng để huấn luyện AI là một mối quan tâm lớn về an toàn mạng. Tất cả mọi người đều có thể tạo ra dữ liệu xấu để tạo ra kết quả họ mong muốn, biến AI trở thành hệ thống thông tin sai lệch lớn nhất thế giới. Khi Microsoft quyết định huấn luyện chatbot bằng cách để nó học hỏi từ Twitter, mọi người đã cố tình gửi những dòng tweet ác ý khiến nó trở thành cỗ máy phân biệt chủng tộc. Một quốc gia có thể phá hủy mọi thứ bằng cách cung cấp dữ liệu thông tin sai lệch của AI hoặc thay đổi nghĩa của từ. Từ đó gây khó khăn cho các chuyên gia về an toàn mạng trong việc tìm, chặn và xóa dữ liệu được thiết kế để lừa đảo.

Tính khả dụng của Web 3.0

Nếu hệ thống web phụ thuộc vào dữ liệu, điều gì sẽ xảy ra khi dữ liệu đó không khả dụng. Các trang web ngày nay có rất nhiều các liên kết bị hỏng, máy móc sẽ cần tạo bản sao cục bộ của mọi thứ trên Internet hoặc truy xuất thông tin theo yêu cầu, chẳng hạn như trong Web 2.0. Điều này có thể làm tăng sự phụ thuộc vào tính khả dụng của hệ thống mà các nhóm công nghệ thông tin không kiểm soát được.

Tính bí mật của dữ liệu

Các vi phạm dữ liệu liên tục xâm phạm thông tin bí mật. Ngoài mối đe dọa đó, nội dung có thể vô tình bị phát tán hoặc đặt ở một vị trí không an toàn. Với việc máy móc quét và đưa dữ liệu đó vào cơ sở tri thức của chúng, chúng có thể làm tăng khả năng dữ liệu riêng tư không chỉ được tìm thấy mà còn được sử dụng. Các nhà lãnh đạo an toàn mạng cần tăng cường khả năng phòng thủ của họ để dự đoán một hệ thống có khả năng phát tán thông tin bí mật.

Nhiều lo ngại về an ninh mạng có thể sẽ xuất hiện khi Web 3.0 hình thành. Tương lai của web 3.0 không có người gác cổng, chứa nội dung có ý nghĩa đối với con người và AI, tất cả như một giấc mơ trở thành hiện thực. Vấn đề an toàn nên được xây dựng ngay từ đầu để giữ cho giấc mơ đó không trở thành một cơn ác mộng.