Chiều ngày 12/9, Bộ trưởng Bộ TT&TT Nguyễn Mạnh Hùng đã chủ trì cuộc họp về việc triển khai thúc đẩy mô hình ngôn ngữ lớn Tiếng Việt, phát triển Trợ lý ảo cho cán bộ, công chức, Trợ lý ảo cho người dân và Trợ lý ảo hỗ trợ rà soát văn bản quy phạm pháp luật.
Dự cuộc họp có Thứ trưởng Nguyễn Huy Dũng cùng lãnh đạo Cục Chuyển đổi số quốc gia, Cục An toàn thông tin, Trung tâm Thông tin; đại diện lãnh đạo các doanh nghiệp: Tập đoàn Công nghiệp - Viễn thông quân đội (Viettel), Công ty cổ phần Tập đoàn công nghệ CMC, Công ty Cổ phần VNG...
Mô hình ngôn ngữ lớn (Large language models) là trung tâm của cuộc cách mạng AI
Mô hình ngôn ngữ lớn (LLM) là một loại mô hình ngôn ngữ được đào tạo bằng cách sử dụng các kỹ thuật học sâu trên tập dữ liệu văn bản khổng lồ. Các mô hình này có khả năng tạo văn bản tương tự như con người và thực hiện các tác vụ xử lý ngôn ngữ tự nhiên khác nhau. LLM có số lượng tham số rất lớn, có thể từ hàng tỷ đến hàng trăm tỷ. Những mô hình này có thể phát hiện các quy luật phức tạp trong ngôn ngữ và tạo ra các văn bản giống như con người tạo ra.
Tháng 11/2022, Open AI công bố ChatGPT trở thành trợ lý ảo xây dựng trên Mô hình ngôn ngữ lớn LLM đã gây ra hiệu ứng toàn cầu, gây ngạc nhiên cho tất cả các quốc gia, gồm cả các cường quốc về công nghệ và AI như Trung Quốc, Hàn Quốc, Nga. Tính đến hết 10/9/2023, cũng mới chỉ có Baidu của Trung Quốc và Naver của Hàn Quốc công bố các mô hình ngôn ngữ lớn tiếng Trung, tiếng Hàn. Còn lại thế giới chưa có mô hình ngôn ngữ đặc thù nào khác với quy mô trên 100 tỷ tham số.
Theo số liệu gần đây của Viện Thông tin Khoa học và Công nghệ Trung Quốc, Hoa Kỳ và Trung Quốc chiếm hơn 80% lượng phân phối mô hình lớn trên thế giới. Trong đó Hoa Kỳ dẫn đầu cuộc đua về số lượng và Trung Quốc cũng đang nhanh chóng theo kịp.
Những đột phá trong xu hướng này được giới phân tích dự đoán có thể thúc đẩy 7% tăng trưởng GDP toàn cầu, tương đương gần 7.000 tỷ USD, trong vòng 10 năm tới.
Toan-canh-cuoc-hop.jpg
Toàn cảnh cuộc họp
Mô hình ngôn ngữ lớn Tiếng Việt phải do các doanh nghiệp Việt Nam tạo ra
Trong phát biểu mới đây tại phiên họp chuyên đề lần thứ hai của Ủy ban Quốc gia về Chuyển đổi số, Bộ trưởng Bộ TT&TT Nguyễn Mạnh Hùng đã khẳng định: “AI đã trở thành như điện của Cách mạng công nghiệp lần thứ 2, như động cơ hơi nước của Cách mạng công nghiệp lần thứ nhất, nó cần được phổ cập, thâm nhập vào mọi lĩnh vực, mọi nơi, mọi chốn, mọi công việc hàng ngày, của mọi người, mọi doanh nghiệp, mọi tổ chức. Nhanh chóng phổ cập hoá ứng dụng AI, nhưng phải là AI do chúng ta phát triển, do chúng ta “nuôi dạy” (dữ liệu, mục tiêu, lựa chọn thuật toán, huấn luyện là của chúng ta). Muốn phổ cập AI thì phải biến nó thành dịch vụ và cung cấp qua mạng viễn thông đến mọi người dân, doanh nghiệp như là dịch vụ điện thoại di động vậy, và giá cũng phải rẻ.”
Tại cuộc họp ngày 12/9/2023, Bộ trưởng Nguyễn Mạnh Hùng cho rằng: “LLM là vấn đề mới, không chỉ đối với cơ quan nhà nước, mà cả đối với các doanh nghiệp công nghệ của Việt Nam”. Các doanh nghiệp tham dự đã tiên phong thực hiện nhiệm vụ triển khai LLM tiếng Việt và trợ lý ảo phục vụ người Việt. Trong đó:
- Tập đoàn Viettel thực hiện việc xây dựng và triển khai Nền tảng LLM Tiếng Việt phục vụ khối cơ quan hành chính và tư pháp; triển khai trợ lý ảo phục vụ cán bộ công chức, viên chức,….
- Tập đoàn CMC thực hiện việc xây dựng và triển khai Trợ lý ảo phục vụ khối cơ quan lập pháp. Trợ lý ảo này giúp cán bộ, công chức trong quá trình xây dựng văn bản quy phạm pháp luật có thể dễ dàng phát hiện sự chồng chéo hay mâu thuẫn giữa các văn bản quy phạm pháp luật đã ban hành với dự thảo đang xây dựng. Tổ công tác của Bộ TT&TT cần phối hợp với CMC để tìm kiếm các luật sư, chuyên gia giỏi về pháp luật để cùng tham gia trong quá trình xây dựng Trợ lý ảo hỗ trợ rà soát văn bản quy phạm pháp luật.
Đối với Trợ lý ảo phục vụ cán bộ, công chức, viên chức và Trợ lý ảo hỗ trợ rà soát văn bản quy phạm pháp luật, tháng 10/2023 sẽ đưa vào thử nghiệm nội bộ, tháng 12/2023 sẽ đưa vào thử nghiệm trong phạm vi hẹp trên 10% tập người dùng.
- Công ty Cổ phần VNG tập trung thực hiện việc triển khai Nền tảng LLM Tiếng Việt và Trợ lý ảo phục vụ người dân cũng như các vấn đề về dịch vụ công, về quyền lợi, trách nhiệm của người dân. Tháng 12/2023 sẽ bắt đầu thử nghiệm nội bộ. Hết tháng 3/2024 sẽ thử nghiệm trên 10% tập người dùng.
qoute-BT-phat-bieu1.jpg
Các doanh nghiệp đều thống nhất về mô hình kiến trúc 4 lớp do Bộ trưởng Nguyễn Mạnh Hùng gợi ý, trong đó có lớp dữ liệu riêng, cho phép các bộ, ngành, địa phương hoặc các tổ chức khác đưa dữ liệu riêng của mình vào huấn luyện và từ đó tạo ra những trợ lý ảo chuyên biệt cho mình.
Theo kế hoạch, dự kiến tháng 12/2023 Bộ TT&TT sẽ mời một số Bộ ngành, địa phương tham gia vào thử nghiệm những phiên bản đầu tiên của LLM tiếng Việt và trợ lý ảo phục vụ người Việt. Thông qua việc thử nghiệm này, chính các Bộ, ngành, địa phương sẽ là người huấn luyện, đóng góp tri thức cho sự phát triển của LLM tiếng Việt và trợ lý ảo phục vụ người Việt.
Bộ trưởng Nguyễn Mạnh Hùng cũng chỉ đạo Tổ công tác của Bộ TT&TT tìm hiểu kinh nghiệm quốc tế liên quan đến Trợ lý ảo hỗ trợ rà soát văn bản quy phạm pháp luật và xây dựng bộ tiêu chuẩn đánh giá (benchmark) cho các mô hình ngôn ngữ lớn tiếng Việt.
Kết luận cuộc họp, Bộ trưởng Nguyễn Mạnh Hùng cho rằng: “LLM tiếng Việt và trợ lý ảo phục vụ người Việt là tác động đến nhận thức, do đó có vai trò cực kỳ quan trọng. Mỗi quốc gia, mỗi triều đại thì dân trí đều là việc quan trọng nhất. Xây dựng được LLM tiếng Việt và trợ lý ảo phục vụ người Việt có ý nghĩa vô cùng lớn, trong nhiều mặt.”./.