Mã hóa đồng hình hoàn toàn: Giải pháp bảo mật của tương lai

Thứ sáu, 05/11/2021 18:21

Mỗi ngày, các tổ chức, doanh nghiệp và chính phủ xử lý rất nhiều thông tin cá nhân (PII) và dữ liệu mật khác. Những thông tin này cần được mã hóa cả khi được lưu trữ (dữ liệu ở trạng thái nghỉ) và khi được truyền (dữ liệu truyền).

20211111-ta6_1.jpg

Mặc dù các thuật toán mã hóa hiện đại hầu như không thể phá vỡ được (vì chúng đòi hỏi nhiều sức mạnh xử lý đến mức nó làm cho quá trình phá vỡ nó quá tốn kém và mất thời gian để có thể khả thi), chúng cũng khiến cho không thể xử lý dữ liệu mà không được giải mã trước. Dữ liệu đã được giải mã để đưa vào quy trình xử lý có thể khiến nó dễ bị tin tặc tấn công hoặc không đảm bảo các quy định về đảm bảo quyền riêng tư. 

Đặc biệt, với sự phát triển nhanh chóng của điện toán lượng tử, việc sử dụng các máy tính lượng tử đang dần phổ biến và ngày càng được tăng cường khả năng xử lý thông tin mạnh mẽ hơn. Như vậy, những giải pháp mã hóa được coi là tin cậy trong thời điểm hiện tại liệu có còn thực sự an toàn trong kỷ nguyên của máy tính lượng tử? 

Mã hóa đồng hình hoàn toàn (fully homomorphic encryption - FHE) có thể giải quyết lỗ hổng vốn có trong tất cả các phương pháp khác để bảo vệ dữ liệu kể trên ngay cả khi điện toán lượng tử đã phát triển.

Phương thức mã hóa hoàn toàn mới an toàn cả trong thế giới lượng tử 

Bất kể các tổ chức, doanh nghiệp đang làm việc với dữ liệu trong trạng thái lưu trữ hay đang trên đường truyền, mã hóa khóa công khai truyền thống đều yêu cầu dữ liệu phải được giải mã trước khi có thể phân tích hoặc thao tác. Nhưng điều gì sẽ xảy ra nếu có một loại mã hóa hoàn toàn đáp ứng nhu cầu không cần phải giải mã dữ liệu trước khi sử dụng – có nghĩa là tính toàn vẹn và quyền riêng tư của dữ liệu được bảo vệ trong khi bạn xử lý dữ liệu đang sử dụng? Đây là một cách để cung cấp các dịch vụ tốt nhất và cá nhân nhất cho khách hàng của bạn trong khi vẫn duy trì sự riêng tư và bảo mật của họ. Nó được gọi là mã hóa đồng hình hoàn toàn (Fully homomorphic encryption – FHE). 

Nhưng chính xác thì mã hóa đồng hình là gì và khả năng ứng dụng trong thế giới thực của nó trong bảo mật dữ liệu ra sao?

Các công nghệ mã hóa hiện nay cho phép doanh nghiệp và tổ chức có thêm một lớp bảo vệ bổ sung cho dữ liệu nhạy cảm nhất của mình. Tuy nhiên, các phương pháp mã hóa truyền thống có một vài hạn chế khó tránh. Đó là việc mặc dù dữ liệu có thể vẫn được mã hóa trong khi nó đang được lưu trữ (ở trạng thái nghỉ) và cũng như khi nó đang được chia sẻ (đang chuyển tiếp) - dữ liệu cần phải được giải mã khi đang được “sử dụng” (bao gồm các tác vụ như xử lý, phân tích, v.v...).

Điều này tạo ra một hạn chế, đó là dữ liệu được hiển thị dưới dạng văn bản thuần túy cho bất kỳ ứng dụng hoặc dịch vụ nào đang thực hiện phân tích - khiến dữ liệu có nguy cơ cao hơn về vi phạm bảo mật, quyền riêng tư hoặc tuân thủ. 

Mã hóa đồng hình hoàn toàn (FHE) là một hình thức mã hóa tiên tiến hơn đã được phát triển trong thập kỷ qua, được thiết kế để thu hẹp khoảng cách nói trên - bằng cách cho phép dữ liệu vẫn được mã hóa ngay cả trong quá trình tính toán. 

Phương pháp toán học đằng sau FHE được thiết kế để các phép tính có thể thực hiện trực tiếp trên dữ liệu được mã hóa (ciphertext) mà không cần các dịch vụ đi kèm để theo dõi liệu việc mã hóa dữ liệu đó có cung cấp kết quả chính xác hay không. 

Với mô hình mã hóa mới này, các nhà cung cấp dịch vụ Đám mây và các bên thứ ba đang lưu trữ dữ liệu được mã hóa của khách hàng sẽ có thể “phân tích” đầy đủ dữ liệu đó thay cho khách hàng mà không cần “nhìn thấy” bất kỳ dữ liệu cá nhân nào ở dạng văn bản thuần túy. 

Do đó, FHE được dự đoán sẽ có tác động lớn đến bảo mật trên Đám mây – tăng thêm một lớp quan trọng về an toàn và quyền riêng tư. Điều này sẽ đặc biệt hữu ích cho các ngành cần được quản lý bảo mật cao như ngân hàng và chăm sóc sức khỏe, những tổ chức đang mong muốn chuyển các dữ liệu nhạy cảm lên Đám mây.

Gartner dự đoán rằng trong vòng 5 năm tới, 20% công ty sẽ có ngân sách cho các dự án bao gồm FHE (ngày nay, chỉ có khoảng 1% công ty làm được điều đó). 

Bên cạnh đó, FHE dựa trên mật mã mạng, được coi là an toàn lượng tử - góp phần gia tăng an toàn môi trường điện toán lượng tử trong tương lai. 

Tóm lại, mã hóa đồng hình là một phương thức mã hóa cho phép mọi dữ liệu được mã hóa trong khi nó được xử lý và thao tác. Nó cho phép chủ sở hữu dữ liệu hoặc bên thứ ba (chẳng hạn như nhà cung cấp cloud) áp dụng các chức năng trên dữ liệu được mã hóa mà không cần tiết lộ các giá trị của dữ liệu. Hệ thống homomorphic cryption giống như các hình thức mã hóa công khai khác ở chỗ nó sử dụng khóa chung để mã hóa dữ liệu và chỉ cho phép cá nhân có khóa riêng phù hợp để truy cập dữ liệu không được mã hóa của nó (mặc dù cũng có ví dụ về mã hóa đồng hình khóa đối xứng). Tuy nhiên, điều làm cho nó khác biệt so với các hình thức mã hóa khác là nó sử dụng hệ thống đại số để cho phép bạn hoặc người khác thực hiện nhiều tính toán (hoặc thao tác) trên dữ liệu được mã hóa. 

Trong thực tế, hầu hết các sơ đồ mã hóa đồng hình hoạt động tốt nhất với dữ liệu được biểu diễn dưới dạng số nguyên và trong khi sử dụng phép cộng và phép nhân làm các hàm vận hành. FHE đòi hỏi một vài vòng tương tác và sử dụng các mạch số học (tập trung vào phép cộng và phép nhân, cho phép bạn thêm và nhân số) thay vì các mạch Boolean như các phương pháp tính toán an toàn khác (như tính toán hai bên [2PC] hoặc đa tổng tính toán - party [MPC]). 

Điều này có nghĩa là dữ liệu được mã hóa có thể được thao tác và phân tích như thể nó ở định dạng văn bản gốc mà không thực sự được giải mã. Nói cách khác, FHE có thể cho phép mọi đối tượng người dùng làm việc và sử dụng dữ liệu được mã hóa mà không cần truy cập hoặc biết nội dung của dữ liệu được giải mã. Họ có thể tính toán và xử lý dữ liệu được mã hóa để có câu trả lời, nhưng chỉ chủ sở hữu dữ liệu mới có thể giải mã được bản mã và hiểu ý nghĩa của dữ liệu đó. 

Tiềm năng vô tận 

Mã hóa đồng hình hoàn toàn trong khi vẫn đang trong giai đoạn phát triển, có rất nhiều tiềm năng để làm cho chức năng phù hợp với quyền riêng tư bằng cách giúp giữ an toàn thông tin mà vẫn có thể truy cập được. Loại mật mã đặc biệt này có khả năng sử dụng bất kỳ chức năng tính toán hiệu quả nào (như cộng và nhân, không chỉ một hay nhiều lần) bất kỳ số lần nào và giúp tính toán đa bên an toàn hiệu quả hơn. Không giống như các hình thức mã hóa khác, nó có thể xử lý các tính toán tùy ý trên bản mã của bạn.

Khi công nghệ FHE tiến bộ, các giải pháp này có thể cho phép các công ty áp dụng các chức năng như tìm kiếm, phân tích và AI vào trong môi trường dữ liệu nhạy cảm của họ mà không tiết lộ dữ liệu đó cho dịch vụ cơ bản - giúp họ duy trì các biện pháp kiểm soát quyền riêng tư và tuân thủ hiện có như một phần của “chiến lược bảo mật không tin cậy”. Ngoài ra, FHE dựa trên mật mã mạng được coi là “an toàn lượng tử” - hoặc có khả năng chống phá vỡ bởi tốc độ tính toán lượng tử trong tương lai.   

Trong một thế giới lý tưởng, FHE có vô số ứng dụng thực tế, từ  hệ thống bỏ phiếu điện tử đến phân tích dữ liệu y tế để cho phép truy vấn riêng tư trong công cụ tìm kiếm... Một số ứng dụng cho FHE bao gồm: 

Bảo mật dữ liệu được lưu trữ trong đám mây. Hãy quay trở lại ý tưởng rằng bạn sở hữu hoặc làm việc tại một công ty dịch vụ tài chính thu thập, lưu trữ và sử dụng thông tin cá nhân và thông tin tài chính nhạy cảm. Tổ chức của bạn sử dụng dữ liệu này để xem xét liệu khách hàng có đủ điều kiện cho vay hay không. Bạn muốn lưu trữ thông tin này trên đám mây để giải phóng tài nguyên CNTT nhưng không hoàn toàn tin tưởng vào bảo mật của nhà cung cấp dịch vụ phần mềm đám mây (SaaS) của mình. (Xem xét rằng  lưu trữ đám mây không phải lúc nào cũng an toàn như chúng ta muốn, đó không phải là mối quan tâm sâu rộng). 

Sử dụng FHE có thể bảo mật dữ liệu lưu trữ trên đám mây trong khi vẫn giữ được khả năng tính toán và tìm kiếm thông tin được mã hóa mà sau này chủ sở hữu có thể giải mã mà không ảnh hưởng đến tính toàn vẹn của dữ liệu như một toàn thể. Đó là một kịch bản cùng có lợi cho doanh nghiệp cũng như khách hàng của bạn.

Kích hoạt phân tích dữ liệu trong các ngành được quy định. FHE cho phép dữ liệu được mã hóa và gia công vào môi trường đám mây thương mại cho mục đích nghiên cứu và chia sẻ dữ liệu trong khi vẫn bảo vệ quyền riêng tư dữ liệu của người dùng hoặc bệnh nhân. Nó có thể được sử dụng cho các doanh nghiệp và tổ chức thuộc nhiều ngành công nghiệp bao gồm dịch vụ tài chính, bán lẻ, công nghệ thông tin và chăm sóc sức khỏe để cho phép mọi người sử dụng dữ liệu mà không thấy các giá trị không được mã hóa của nó. Ví dụ, FHE cho phép các nhà cung cấp dịch vụ phân tích dự đoán phân tích dữ liệu y tế một cách an toàn mà không gây nguy hiểm cho quyền riêng tư dữ liệu. 

Cải thiện an ninh bầu cử và minh bạch. Các nhà nghiên cứu đang nghiên cứu cách sử dụng FHE để làm cho các cuộc bầu cử dân chủ an toàn và minh bạch hơn. Ví dụ, lược đồ mã hóa Paillier, sử dụng các hoạt động bổ sung, sẽ phù hợp nhất cho các ứng dụng liên quan đến bỏ phiếu vì nó cho phép người dùng thêm các giá trị khác nhau theo cách không thiên vị trong khi giữ giá trị riêng tư. Công nghệ này không chỉ có thể bảo vệ dữ liệu khỏi sự thao túng. Nó có thể cho phép xác minh độc lập bởi các bên thứ ba được ủy quyền.

Những bước tiến về tốc độ và bước đầu ứng dụng thực tế 

Nhóm Nghiên cứu thuộc Tập đoàn IBM (IBM Reseach) đã tiến hành nghiên cứu công nghệ FHE trong hơn một thập kỷ qua và được coi là đơn vị tiên phong trong lĩnh vực này. 

FHE lần đầu tiên được thảo luận vào cuối những năm 1970, nhưng bước đột phá thực sự đến vào năm 2009 khi nó được Craig Gentry (một nhà mật mã học làm việc tại IBM Research thời điểm đó) chứng minh lần đầu tiên trong báo cáo Mã hoá đồng hình hoàn toàn sử dụng lưới thích hợp và đã được trích dẫn lại rất nhiều sau này. 

Vào thời điểm đó, các phép tính của FHE rất chậm đối với việc sử dụng thực tế. Một phép tính đơn giản khi không mã hóa được máy tính thực hiện trong chớp mắt, nhưng khi đưa vào mã hóa đồng hình thì hệ thống phải mất nhiều ngày hoặc vài tuần mới thực hiện xong. 

Kể từ đó, các nhà nghiên cứu trong ngành đã không ngừng làm việc để thúc đẩy FHE - tinh chỉnh các phương trình toán học, cũng như tiên phong thử nghiệm ứng dụng FHE cho đa dạng các loại phân tích và các trường hợp sử dụng khác nhau. 

Ngành công nghiệp tính toán đã phát triển theo cấp số nhân và các thuật toán đằng sau FHE đã tiên tiến. Thử nghiệm đã chỉ ra rằng FHE tại là khả năng được thực hiện ở giây cho mỗi bit (1), làm cho nó đủ nhanh cho nhiều loại trường hợp sử dụng thực tế và thử nghiệm ban đầu với các doanh nghiệp.

Gartner ước tính rằng đến năm 2025, ít nhất 20% công ty sẽ có ngân sách cho các dự án bao gồm mã hóa đồng hình hoàn toàn (FHE), tăng so với mức dưới 1% hiện nay (2).  

Đầu năm nay, IBM đã phát hành các công cụ và tài liệu giáo dục cho các nhà phát triển, đồng thời làm việc với một số khách hàng về các chương trình thử nghiệm ban đầu cho FHE. IBM Security hiện đang thực hiện bước quan trọng tiếp theo trong việc đưa FHE đến với nhiều đối tượng hơn, tung ra dịch vụ tiên tiến nhất để giúp các công ty bắt đầu với Mã hóa đồng hình hoàn toàn.  

Trong vài năm qua, IBM Research đã nỗ lực để đưa FHE ra khỏi phòng lab và đưa vào các ứng dụng của doanh nghiệp. Trong năm 2020, IBM đã công bố một số sản phẩm và dịch vụ quan trọng liên quan tới FHE bao gồm: 

* IBM cùng với Ngân hàng Banco Bradesco SA của Brazil đã xuất bản một báo cáo chứng minh khả năng mã hóa đồng hình dữ liệu ngân hàng, chẳng hạn như giao dịch thẻ tín dụng và mô hình học máy, và cho thấy rằng có thể chạy các dự đoán với độ chính xác như không có mã hóa và hiệu suất phù hợp.

* Ra mắt bộ công cụ mã nguồn mở cho các nhà phát triển bắt đầu thử nghiệm với FHE (Bộ công cụ mã hóa đồng hình hoàn toàn của IBM) - cung cấp các mã cài đặt và môi trường phát triển mà các nhà phát triển có thể sử dụng để thử nghiệm loại mô hình lập trình an toàn mới này. 

* Nhóm Bảo mật của IBM (IBM Security) lần đầu tiên ra mắt Dịch vụ Mã hóa Đồng hình - để chia sẻ và chuẩn bị cho khách hàng trong việc xây dựng và triển khai các ứng dụng hỗ trợ FHE khi công nghệ này đạt đến độ chín trong tương lai gần. Dịch vụ mã hóa đồng hình bảo mật của IBM sẽ bao gồm cả các công cụ và hỗ trợ chuyên gia cần thiết để bắt đầu tìm hiểu và thử nghiệm với FHE - cũng như môi trường lưu trữ có thể mở rộng trên Đám mây của IBM.

Ông  Patrick Bruinsma, Giám đốc giải pháp IBM Z, IBM Đông Nam Á, chia sẻ: “Bộ công cụ FHE dành cho Linux, mang FHE đến nhiều bản phân phối Linux cho kiến trúc IBM Z và x86. Bộ công cụ dành cho IBM Z hỗ trợ Ubuntu tại thời điểm khởi chạy. IBM hỗ trợ các phiên bản Ubuntu, Fedora và CentOS của bộ công cụ dành cho nền tảng x86. Các nhà phát triển Docker có kinh nghiệm có thể dễ dàng chuyển bộ công cụ này sang bản phân phối ưa thích của họ. Hành trình để FHE có sức lan tỏa bắt đầu với những triển khai tham khảo này, nhưng chúng tôi dự đoán rằng nó sẽ phát triển với sự tham gia của cộng đồng. 

Điều này đưa cam kết của IBM đối với Linux và bảo mật tiến thêm một bước nữa để bổ sung khả năng bảo mật cho dữ liệu đang sử dụng - liên kết còn thiếu của mã hóa end-to-end. Hỗ trợ phát hành ban đầu của chúng tôi nhắm mục tiêu đến các nhà phát triển doanh nghiệp trên các nền tảng phân tán cũng như hỗ trợ hàng ngày trên IBM Z để cho phép khách hàng của chúng tôi, những khách hàng mà thế giới tin tưởng hàng ngày với dữ liệu nhạy cảm nhất, dễ dàng thử nghiệm với FHE”.

Để đưa FHE vào các sản phẩm máy chủ dòng thấp, cần bắt đầu thu hút các nhà lãnh đạo doanh nghiệp và các nhà phát triển trong các ngành khác nhau tìm hiểu và làm việc với các công nghệ mới. 

Dịch vụ Mã hóa Đồng hình Bảo mật của IBM sẽ bao gồm nền tảng, công cụ và hỗ trợ chuyên gia cần thiết để bắt đầu tìm hiểu và thử nghiệm với FHE. Cụ thể, dịch vụ này bao gồm: 

- Hướng dẫn, tư vấn và chia sẻ từ các chuyên gia mật mã của IBM Security, giúp doanh nghiệp xây dựng các kỹ năng cần thiết để thiết kế và làm việc với các ứng dụng hỗ trợ FHE. 

Các công cụ FHE do IBM Research phát triển sẽ cung cấp các mẫu thử cho các trường hợp sử dụng FHE phổ biến như những tìm kiếm được mã hóa, AI và học máy. 

- Một môi trường lưu trữ có thể mở rộng trên Đám mây của IBM để các nhà phát triển bắt đầu thử nghiệm và xây dựng các nguyên mẫu cho các ứng dụng hỗ trợ FHE của riêng họ. 

FHE chạy các tính toán trên dữ liệu được mã hóa hoàn toàn, hứa hẹn bảo mật tốt nhất, bao gồm nhiều phương pháp tính toán và cơ hội phát triển hơn so với các kỹ thuật khác.

Trong các bản phát hành sắp tới, IBM dự định đưa chức năng AI mới vào bộ công cụ. Sau khi chứng minh việc học máy có thể hoạt động đồng hình, chức năng AI mới này sắp tới sẽ cung cấp bộ công cụ cho người dùng và khách hàng môi trường thử nghiệm khác để thực hành. 

“Ngoài ra, chúng tôi đang nghiên cứu các cải tiến hiệu suất đối với Bộ công cụ FHE và các thư viện công cụ cơ bản khác bằng cách sử dụng các khả năng độc đáo được cung cấp bởi IBM Z”, ông Patrick Bruinsma cho biết thêm.

Còn cần nhiều hơn những đột phá mới 

Mục tiêu đằng sau mã hóa đồng hình hoàn toàn là cho phép mọi người sử dụng dữ liệu được mã hóa để thực hiện các hoạt động hữu ích mà không cần truy cập vào khóa mã hóa. Đặc biệt, khái niệm này có các ứng dụng để cải thiện bảo mật điện toán đám mây.  Nếu bạn muốn lưu trữ dữ liệu nhạy cảm, được mã hóa trong đám mây nhưng không tin tưởng nhà cung cấp đám mây của mình hoặc muốn có nguy cơ bị hacker xâm nhập vào tài khoản/ứng dụng đám mây của bạn, thì nó cung cấp cho bạn cách để kéo, tìm kiếm và thao tác dữ liệu của bạn mà không phải cho phép nhà cung cấp đám mây hoặc Google truy cập vào dữ liệu trên các tệp bạn muốn truy cập. 

Điều hấp dẫn của việc sử dụng hình thức mã hóa này là tính linh hoạt của nó đi kèm với chi phí tốc độ. Thật không may, trong trạng thái hiện tại của nó, mã hóa đồng hình là thực sự chậm. Trong cuộc đua mã hóa, nó đang chạy ở vị trí cuối cùng. Điều này, một phần, bởi vì mã hóa đồng hình có chi phí tính toán lớn hơn so với các hoạt động văn bản gốc. 

Với mục tiêu làm cho mã hóa đồng hình trở nên phổ biến, IBM đã phát hành phiên bản đầu tiên của thư viện HElib C ++ vào năm 2016 – nhưng báo cáo đã chạy chậm hơn 100 nghìn tỷ lần so với các hoạt động của văn bản gốc. Hiện tại, IBM đã đưa ra một phiên bản nhanh hơn 75 lần, nhưng thậm chí nó vẫn cực kỳ chậm so với làm việc với dữ liệu không được mã hóa.

Các nhà nghiên cứu, như Gentry, đang nỗ lực tìm cách tăng tốc quá trình dữ liệu đang sử dụng, dữ liệu trong các ứng dụng xử lý. Một công ty bảo mật dữ liệu, ENVEIL, tuyên bố sử dụng mã hóa đồng hình như một phần trong khuôn khổ của họ để bảo vệ dữ liệu đang sử dụng. Một công ty khác, một công ty khởi nghiệp có tên Duality, đang làm việc để tạo ra các sản phẩm thương mại. Điều đó sẽ cho phép các công ty chia sẻ dữ liệu thô với các bên thứ ba mà không có quyền truy cập vào nó.  

Cho đến tời điểm hiện tại, FHE vẫn là một công nghệ đang tiếp tục được nghiên cứu, hoàn thiện và chưa sẵn sàng được sử dụng một cách phổ biến trong thế giới thực. Giống như bất kỳ công nghệ mới nào, trước tiên nó phải trải qua quá trình thử nghiệm, tạo mẫu và triển khai beta trước khi sẵn sàng sử dụng đại trà. Điều ưu tiên vẫn là tìm cách giảm chi phí tính toán và tăng tốc quá trình sử dụng ở quy mô lớn hơn. Hy vọng, với những nỗ lực không ngừng của các nhà nghiên cứu, chúng ta sẽ sớm thấy một phiên bản nhanh hơn của mã hóa đồng hình hoàn toàn để có thể áp dụng cho nhiều ứng dụng trong thế giới thực trong các ngành công nghiệp khác nhau.

banner
icon

Cổng dịch vụ công
Quốc Gia

Những thông tin thủ tục hành chính
khai báo online tại đây

Xem chi tiết icon
icon

Chính sách
pháp luật Việt Nam

Cập nhật thông tin, chính sách
pháp luật Việt Nam

Xem chi tiết icon

Cổng thông tin điện tử của các đơn vị thuộc Bộ

Doanh nghiệp

Top