
Đại diện các đơn vị trong buổi lễ ra mắt Liên minh AI Âu Lạc - Ảnh: DNCC
Cái "bắt tay" của những tổ chức công nghệ
Liên minh là cái "bắt tay" của những tổ chức công nghệ hàng đầu Việt Nam hiện nay như MobiFone, VNPT, FPT, CMC, Zalo…, tập trung vào ba lĩnh vực chính gồm: Nghiên cứu phát triển, Xây dựng quy chuẩn và chính sách về AI, Đào tạo.
Trong đó với lĩnh vực nghiên cứu phát triển, các thành viên sẽ cùng phát triển các mô hình ngôn ngữ lớn LLM với khả năng xử lý tiếng Việt chính xác, tự nhiên, phù hợp với văn hóa và bản sắc Việt Nam, góp phần nâng cao dân trí và thúc đẩy kinh tế quốc gia.
Sự ra đời của Liên minh không chỉ mở ra một chương mới cho hành trình phát triển AI tại Việt Nam, mà còn hứa hẹn một tương lai tươi sáng, nơi công nghệ phục vụ thiết thực cho cộng đồng, gắn với lợi ích quốc gia.
Phát biểu tại lễ ra mắt liên minh, ông Nguyễn Minh Tú - Giám đốc Công nghệ Zalo khẳng định mong muốn đóng góp không chỉ cho công cuộc phát triển LLM mà còn cho nền chủ quyền công nghệ của Việt Nam.
"Gia nhập Liên Minh AI Âu Lạc, chúng tôi mong muốn đóng góp vào công cuộc phát triển các mô hình ngôn ngữ lớn LLM tại Việt Nam. Hy vọng có thể tạo ra những sản phẩm AI chất lượng, phục vụ cho người Việt một cách thiết thực, cũng như góp sức mình vào tiến trình phát triển khoa học công nghệ của đất nước.
Việc gia nhập liên minh cũng khẳng định quyết tâm tự chủ công nghệ, làm chủ AI của Zalo. Chúng tôi tin rằng, chính người Việt có thể làm chủ mô hình LLM bằng tiếng Việt. Đồng thời, chúng tôi mong muốn chung tay tạo ra một cộng đồng AI mở, minh bạch, nhằm khơi dậy sáng tạo, ứng dụng AI rộng khắp."
Ông Nguyễn Minh Tú cũng cho biết sẵn sàng chia sẻ kinh nghiệm xây dựng thành công mô hình AI thuần Việt và bộ đánh giá năng lực tiếng Việt VMLU với hơn 10.000 câu hỏi.

Ông Nguyễn Minh Tú phát biểu tại sự kiện ra mắt Liên minh AI Âu Lạc - Ảnh: DNCC
Phục vụ lợi ích cộng đồng và quốc gia
Tại Việt Nam hiện nay, Zalo là một trong những đơn vị hiếm hoi đã thành công phát triển mô hình ngôn ngữ lớn (LLM).
Không chọn kỹ thuật tinh chỉnh (fine-tuned model) như nhiều doanh nghiệp, đơn vị phát triển LLM theo phương thức tự huấn luyện mô hình từ đầu (from-scratch model).
Lựa chọn này có nhiều khó khăn đòi hỏi phải tạo dựng từ số 0 - kiến trúc mô hình, khởi tạo tham số, xử lý dữ liệu và huấn luyện mô hình từ tập dữ liệu xử lý.
Quyết định trên không phải chạy đua với các người khổng lồ nước ngoài mà hiện thực khát vọng của người Việt làm chủ mô hình LLM thuần Việt, hiểu tiếng Việt và phục vụ cho người Việt.
Dù gặp nhiều thách thức trong quá trình phát triển công nghệ LLM, nhờ chiến lược linh hoạt, đơn vị đã rút ngắn thời gian phát triển thành công mô hình LLM từ 18 tháng xuống 6 tháng.
Cuối năm 2023, mô hình đầu tiên KiLM 7B tham số ra mắt tại sự kiện Zalo AI Summit. Trên nền tảng đánh giá VMLU (Vietnamese Multitask Language Understanding Benchmark Suite for Large Language Models), mô hình KiLM 7B đạt năng lực gấp 1.5 lần so với ChatGPT-3.5 của OpenAPI trên bộ test VMLU public.

Cuối năm 2024, mô hình LLM của Zalo đứng Top 2 trên bảng xếp hạng của VMLU - Ảnh: DNCC
Tới cuối năm 2024, mô hình với 13B tham số của đơn vị vượt qua các tên tuổi lớn như GPT-4 (OpenAI), Gemma2-9B (Google) hay Phi-3-small (Microsoft), chỉ đứng sau mô hình LlaMA-70B của Meta về năng lực xử lý Tiếng Việt của VMLU.
Trong tương lai, đơn vị sẽ tiếp tục nghiên cứu, hoàn thiện hơn mô hình LLM, cũng như đẩy mạnh tính ứng dụng thực tiễn của LLM trong đời sống của hàng triệu người dùng Việt.
Gia nhập liên minh AI Âu Lạc thể hiện rõ quyết tâm của Zalo trong việc phát triển AI theo hướng an toàn, có trách nhiệm, phục vụ lợi ích cộng đồng và quốc gia.
Tối đa: 1500 ký tự
Hiện chưa có bình luận nào, hãy là người đầu tiên bình luận