Các doanh nghiệp tiên phong phát triển Mô hình ngôn ngữ lớn tiếng Việt và trợ lý ảo Việt Nam

AI, nhất là học sâu, đã qua giai đoạn khám phá, nghiên cứu, đã bước vào giai đoạn ứng dụng. Nghiên cứu, khám phá thì cần giới tinh hoa, bỏ ra công sức vài chục năm mới có một đột phá. Giai đoạn ứng dụng thì chỉ cần mức kỹ sư, cần nhiều kỹ sư mức ứng dụng. Ai nhanh hơn trong ứng dụng thì sẽ được hưởng lợi nhiều hơn - Bộ trưởng Bộ Thông tin và Truyền thông Nguyễn Mạnh Hùng.

qoute-BT-phat-bieu.jpg

Chiều ngày 12/9, Bộ trưởng Bộ TT&TT Nguyễn Mạnh Hùng đã chủ trì cuộc họp về việc triển khai thúc đẩy mô hình ngôn ngữ lớn Tiếng Việt, phát triển Trợ lý ảo cho cán bộ, công chức, Trợ lý ảo cho người dân và Trợ lý ảo hỗ trợ rà soát văn bản quy phạm pháp luật.

Dự cuộc họp có Thứ trưởng Nguyễn Huy Dũng cùng lãnh đạo Cục Chuyển đổi số quốc gia, Cục An toàn thông tin, Trung tâm Thông tin; đại diện lãnh đạo các doanh nghiệp: Tập đoàn Công nghiệp - Viễn thông quân đội (Viettel), Công ty cổ phần Tập đoàn công nghệ CMC, Công ty Cổ phần VNG...

Xây dựng được mô hình ngôn ngữ lớn (Large language models- MML) tiếng Việt và trợ lý ảo phục vụ người Việt có ý nghĩa vô cùng lớn trong nhiều mặt

Phát biểu mới đây tại phiên họp chuyên đề lần thứ hai của Ủy ban Quốc gia về Chuyển đổi số, Bộ trưởng Bộ TT&TT Nguyễn Mạnh Hùng khẳng định: “AI đã trở thành như điện của Cách mạng công nghiệp lần thứ 2, như động cơ hơi nước của Cách mạng công nghiệp lần thứ nhất. Nó cần được phổ cập, thâm nhập vào mọi lĩnh vực, mọi nơi, mọi chốn, mọi công việc hàng ngày, của mọi người, mọi doanh nghiệp, mọi tổ chức. Nhanh chóng phổ cập hoá ứng dụng AI, nhưng phải là AI do chúng ta phát triển, do chúng ta “nuôi dạy” (dữ liệu, mục tiêu, lựa chọn thuật toán, huấn luyện là của chúng ta)”.

Thực tế cho thấy, tri thức của mỗi người đều được hấp thụ, hình thành trong quá trình hoạt động hoặc quan hệ giao tiếp. Trí nhớ và khả năng tổng hợp, khái quát hóa của mỗi người cũng khác nhau. Trợ lý ảo có khả năng tổng hợp, sắp xếp lượng tri thức nhiều hơn bất kỳ người nào, giúp khái quát hóa tốt hơn. Với sự trợ giúp của Trợ lý ảo, người kém và người giỏi sẽ thu hẹp đáng kể khoảng cách tri thức cũng như khả năng đáp ứng công việc cơ bản.

Tri thức, ngoài sách vở, tài liệu còn được hình thành rất nhiều từ kinh nghiệm thực tiễn. Vì vậy, Trợ lý ảo càng được nhiều cán bộ, công chức sử dụng thì càng thu thập, tổng hợp được nhiều thông tin, tri thức. Do đó các thế hệ cán bộ, công chức sẽ hưởng lợi, tiếp thu được tối đa tri thức, kinh nghiệm của đồng nghiệp và thế hệ đi trước.

Tại cuộc họp ngày 12/9/2023, Bộ trưởng Nguyễn Mạnh Hùng cho rằng, LLM tiếng Việt và trợ lý ảo phục vụ người Việt là tác động đến nhận thức, do đó có vai trò cực kỳ quan trọng bởi đối với mỗi quốc gia thì dân trí đều là việc quan trọng nhất. Xây dựng được LLM tiếng Việt và trợ lý ảo phục vụ người Việt có ý nghĩa vô cùng lớn, trong nhiều mặt. 

Toan-canh-cuoc-hop.jpg

Toàn cảnh cuộc họp

Mô hình ngôn ngữ lớn tiếng Việt phải do các doanh nghiệp Việt Nam tạo ra

Theo Bộ trưởng Nguyễn Mạnh Hùng, LLM là vấn đề mới, không chỉ đối với cơ quan nhà nước, mà cả đối với các doanh nghiệp công nghệ của Việt Nam và Mô hình ngôn ngữ lớn tiếng Việt, trợ lý ảo phục vụ người Việtphải do các doanh nghiệp Việt Nam tạo ra.

Các doanh nghiệp tham dự cuộc họp sẽ tiên phong thực hiện nhiệm vụ triển khai LLM tiếng Việt và trợ lý ảo phục vụ người Việt. Theo đó:

- Việc xây dựng và triển khai Nền tảng LLM Tiếng Việt phục vụ khối cơ quan hành chính và tư pháp; triển khai trợ lý ảo phục vụ cán bộ công chức, viên chức do Tập đoàn Viettel thực hiện. Trợ lý ảo này giúp thống kê, phân loại đầy đủ chính xác các tài liệu, số liệu mới nhất theo trình tự thời gian và cung cấp các số liệu có liên quan đến vấn đề cần xử lý. Vừa qua, Tập đoàn Viettel đã thử nghiệm thành công Trợ lý ảo pháp luật phục vụ hệ thống tòa án. Tính đến tháng 8/2023, Trợ lý ảo pháp luật đã hỗ trợ hơn 12.000 tài khoản cho 100% thẩm phán, cán bộ, công chức của Tòa án; có hơn 3 triệu lượt sử dụng, trung bình có 5.000-6.000 lượt hỏi đáp, tra cứu mỗi ngày, giúp giảm 30% khối lượng công việc, thời gian so với thao tác truyền thống. Những kinh nghiệm thực tiễn từ việc xây dựng Trợ lý ảo pháp luật sẽ là tiền đề quan trong để Tập đoàn Viettel tiếp tục thực hiện hiệu quả việc xây dựng, triển khai Nền tảng LLM Tiếng Việt phục vụ khối cơ quan hành chính và tư pháp.

- Việc xây dựng và triển khai Trợ lý ảo hỗ trợ rà soát công tác xây dựng văn bản quy phạm pháp luật do Tập đoàn CMC thực hiện. Trợ lý ảo này sẽ giúp cơ quan có thẩm quyền và cán bộ, công chức thực thi nhiệm vụ bảo đảm thực hiện chuẩn xác quy định về trình tự, thủ tục xây dựng, ban hành văn bản quy phạm pháp luật. Dễ dàng phát hiện sự chồng chéo hay mâu thuẫn về quy định giữa các văn bản quy phạm pháp luật đã ban hành, hoặc trong dự thảo đang xây dựng với các văn bản liên quan; nhanh chóng phát hiện các quy định sai về thẩm quyền xử lý, giải quyết các vấn đề được điều chỉnh trong văn bản quy phạm pháp luật và tính hợp hiến, hợp pháp của văn bản. Ngoài ra, Trợ lý ảo này cũng có thể cung cấp những thông tin, dữ liệu về kinh nghiệm thực hiện và giải quyết vấn đề liên quan đến chính sách trong văn bản quy phạm pháp luật được giao xây dựng. Giúp giảm tải công việc, tiết kiệm thời gian, chi phí và nâng cao hiệu quả của công tác xây dựng pháp luật. Tổ công tác của Bộ TT&TT cần phối hợp với CMC để tìm kiếm các luật sư, chuyên gia giỏi về pháp luật để cùng tham gia trong quá trình xây dựng Trợ lý ảo hỗ trợ rà soát văn bản quy phạm pháp luật.

Đối với Trợ lý ảo phục vụ cán bộ, công chức, viên chức và Trợ lý ảo hỗ trợ rà soát văn bản quy phạm pháp luật, tháng 10/2023 sẽ đưa vào thử nghiệm nội bộ, tháng 12/2023 sẽ đưa vào thử nghiệm trong phạm vi hẹp trên 10% tập người dùng.

- Việc triển khai Nền tảng LLM Tiếng Việt và Trợ lý ảo phục vụ người dân cũng như các vấn đề về dịch vụ công, về quyền lợi, trách nhiệm của người dân do Công ty Cổ phần VNG thực hiện. Theo đó, Trợ lý ảo này giúp tự động hoá các quy trình trả lời, tương tác về những vấn đề người dân quan tâm, tiết kiệm nhân công, nâng cao chất lượng phục vụ của các cơ quan nhà nước, như phổ biến pháp luật, hướng dẫn thực hiện các quy định về trình tự, thủ tục liên quan đến quyền lợi, trách nhiệm của người dân và xác định đúng thẩm quyền giải quyết, xử lý của các cơ quan hành chính nhà nước. Tháng 12/2023 sẽ bắt đầu thử nghiệm nội bộ. Hết tháng 3/2024 sẽ thử nghiệm trên 10% tập người dùng.

qoute-BT-phat-bieu1.jpg

Tại cuộc họp, các doanh nghiệp đều thống nhất về mô hình kiến trúc 4 lớp do Bộ trưởng Nguyễn Mạnh Hùng gợi ý, trong đó có lớp dữ liệu riêng, cho phép các Bộ, ngành, địa phương hoặc các tổ chức khác đưa dữ liệu riêng của mình vào huấn luyện và từ đó tạo ra những trợ lý ảo chuyên biệt cho mình.

Theo kế hoạch, dự kiến tháng 12/2023 Bộ TT&TT sẽ mời một số Bộ, ngành, địa phương tham gia vào thử nghiệm những phiên bản đầu tiên của LLM tiếng Việt và trợ lý ảo phục vụ người Việt. Thông qua việc thử nghiệm này, chính các Bộ, ngành, địa phương sẽ là người huấn luyện, đóng góp tri thức cho sự phát triển của LLM tiếng Việt và trợ lý ảo phục vụ người Việt.

Bộ trưởng Nguyễn Mạnh Hùng cũng chỉ đạo Tổ công tác của Bộ TT&TT tìm hiểu kinh nghiệm quốc tế liên quan đến Trợ lý ảo hỗ trợ rà soát văn bản quy phạm pháp luật và xây dựng bộ tiêu chuẩn đánh giá (benchmark) cho các mô hình ngôn ngữ lớn tiếng Việt./.