Vân tay trình duyệt là gì?
Các website có thể sử dụng vân tay trình duyệt để xác định danh tính của bạn. Chúng thực hiện điều đó bằng cách chạy một đoạn mã tìm kiếm dữ liệu đặc trưng mà trình duyệt gửi đến website và từ đó dựng nên hồ sơ về bạn. Hồ sơ này được gọi là một vân tay bởi, giống như vân tay trên ngón tay bạn, chỉ cần một lượng dữ liệu đầy đủ, nó sẽ trở nên độc nhất, tức vẽ lên được một bức tranh về chính bạn chứ không thể nhầm lẫn với bất kỳ ai khác.
Tuy nhiên, trước khi đi sâu vào vấn đề, hãy làm rõ một số thuật ngữ: "vân tay trình duyệt" và "vân tay thiết bị" thường được sử dụng thay thế cho nhau, nhưng điều đó không hoàn toàn chính xác. Vân tay thiết bị, hay vân tay máy, là thông tin về thiết bị bạn đang sử dụng, được thu thập thông qua một trình duyệt hoặc một ứng dụng.
Vân tay trình duyệt có độ chi tiết cao hơn, và là toàn bộ thông tin thu thập được thông qua trình duyệt. Bên cạnh thông tin thiết bị, nó còn bao gồm những dữ liệu như loại và số phiên bản của trình duyệt bạn đang sử dụng, hệ điều hành trên máy bạn, ngôn ngữ hiển thị trên trình duyệt, và rất nhiều điểm dữ liệu nhỏ nhặt khác, như độ phân giải màn hình chẳng hạn.
Thoạt nhìn, chúng có vẻ là những thông tin vô thưởng vô phạt. Tuy nhiên, với đủ số lượng điểm dữ liệu, bức tranh về người dùng trình duyệt sẽ ngày càng trở nên rõ ràng hơn. Dữ liệu càng chính xác, website sẽ có thể nắm khá rõ bạn là ai và sử dụng thông tin đó để nhắm quảng cáo đến bạn.
Ví dụ, có một nhóm rất nhiều người cùng sử dụng một phiên bản Android cụ thể. Và trong số đó có một nhóm rất nhiều người cùng sử dụng một phiên bản Chrome nhất định, trong đó lại có một nhóm rất nhiều người đặt ngôn ngữ trình duyệt là tiếng Pháp, trong đó tiếp tục có một nhóm rất nhiều người sử dụng độ phân giải 1920x1080... Đoạn mã của website sẽ lọc thông tin qua một hệ thống đường hầm phức tạp với nhiều ngõ ngách, và mỗi lần nó bước qua một cánh cửa, nó lại tiến đến gần bạn hơn.
Vân tay trình duyệt hoạt động ra sao?
Danh sách các điểm dữ liệu có thể được tận dụng để thu hẹp dần các tiêu chí tìm người là rất dài, và bạn sẽ phải ngạc nhiên khi biết các thuật toán truy dấu vân tay chính xác đến mức nào. Ví dụ, trong một nghiên cứu năm 2016, có đến 81% số khách ghé thăm các website đã bị lập hồ sơ. Điều này không chỉ được thực hiện bằng cách sử dụng dữ liệu thụ động, như loại trình duyệt và độ phân giải màn hình, mà còn thông qua các phương thức chủ động hơn. Ví dụ:
- Lấy vân tay canvas: mã vân tay sẽ tạo ra một lớp phủ (gọi là canvas) vô hình lên phía trên hình ảnh của website bạn đang xem, và canvas này sẽ hiển thị khác so với đoạn mã vân tay tuỳ thuộc vào loại phần cứng đồ hoạ bạn đang sử dụng. Đây là một cách khá hiệu quả để xác định card đồ hoạ và driver của card đó. Lấy vân tay WebGL hoạt động theo phương thức tương tự.
- Lấy vân tay âm thanh: loại mã vân tay này sẽ phân tích cách âm thanh được phát ra trên máy tính của bạn. Những biến động rất nhỏ trong dải âm cũng có thể tiết lộ driver âm thanh bạn đang dùng.
- Lấy vân tay phương tiện: phương thức này lọc hàng loạt driver phương tiện trên máy tính của bạn và xác định chúng càng nhiều càng tốt.
Những mánh khoé lấy vân tay trình duyệt nói trên không phải nhằm tìm ra một điểm dữ liệu cụ thể để cho mã vân tay biết bạn là ai, mà nhằm tìm càng nhiều thông tin càng tốt và tích luỹ chúng lại để dựng nên một bức tranh về bạn.
Tuy nhiên, không phải lúc nào lấy vân tay cũng là hành vi xấu. Kỹ thuật này còn được dùng để phục vụ các mục đích bảo mật. Ví dụ, khả năng rất cao công ty thẻ tín dụng của bạn đang thu thập vân tay mỗi khi bạn đăng nhập để đảm bảo chính bạn làm điều đó chứ không phải ai khác. Bạn có lẽ cũng từng thấy nhiều cảnh báo khi đăng nhập tài khoản từ một vị trí lạ, hoặc từ một thiết bị khác.
Hồ sơ vân tay có ích gì?
Lý do chủ yếu của việc tạo ra vân tay là để quảng cáo có thể nhắm đến người dùng một cách chính xác hơn. Thông qua thu hẹp tiêu chí định danh một người, một thuật toán sẽ dễ dàng quyết định nên hiển thị hoặc không hiển thị quảng cáo nào hơn thông thường. Nếu, ví dụ, nó xác định được bạn đang dùng một thiết bị Android, bạn có lẽ sẽ không thấy bất kỳ quảng cáo nào liên quan iPhone!
Cách miêu tả này có khiến bạn liên tưởng đến cookies trình duyệt? Dù cookies và vân tay cùng phục vụ một mục đích tương tự, chúng lại hoạt động khá khác biệt. Cookie giống như một thiết bị theo dõi. Một khi nó đã xuất hiện trên máy tính của bạn, website cài cắm nó sẽ biết bạn ở đâu và đang làm gì. Vân tay trình duyệt giống số liệu thống kê hơn. Nó sử dụng dữ liệu tập hợp về bạn và thiết bị của bạn để xác định chính xác bạn là ai và đánh dấu lại thời điểm bạn ghé thăm website, nhưng nó không thể theo dấu bạn ngoài phạm vi website được.
Bởi vậy, dữ liệu mà cookie thu thập sẽ có giá trị hơn, nhưng bạn có thể tắt chúng đi, và các trình duyệt cũng ngày càng tăng cường việc chặn cookies bên thứ ba trong nỗ lực nhằm dẹp bỏ vấn nạn theo dõi trực tuyến. Vân tay thì gần như ngược lại: bởi phần lớn dữ liệu mà nó thu thập có vai trò rất quan trọng trong quá trình bạn xem internet, nên không có cách nào để tắt nó đi cả. Nó ít khả năng tiết lộ thông tin nhạy cảm hơn, nhưng lại không thể bị phát hiện, và tắt nó là điều gần như bất khả thi.
Bảo vệ bản thân khỏi vân tay trình duyệt
Một điểm đáng ghét của vân tay trình duyệt là bạn không thể né tránh nó. Có vài cách để tắt một số dữ liệu có khả năng bị thu thập bằng sử dụng các phần mở rộng (như NoScript, vốn có chức năng tắt JavaScript) hoặc các chương trình tương tự trình duyệt (như Tor), nhưng dù các chương trình này giữ cho bạn được an toàn, chúng cũng khiến đại đa số các website trở nên rất khó tiếp cận. Hầu hết các website sẽ không hoạt động nếu không có thông tin thu thập từ các đoạn mã vân tay.
Tóm lại, bạn đang đứng trước thế tiến thoái lưỡng nan khi tìm cách tránh né vân tay trình duyệt. Ngay cả những chiến thuật thường được dùng để ẩn nấp trước lực lượng hành pháp, như sử dụng song song chế độ ẩn danh và VPN, cũng không tác động đến vân tay trình duyệt. Dẫu vậy, một số trình duyệt bao gồm Mozilla khẳng định đã phát triển được những kỹ thuật để chặn việc lấy vân tay. Nhưng nhìn chung, vân tay trình duyệt có lẽ sẽ chưa thể biến mất trong một sớm một chiều.