
CEO Zhipu AI Trương Bằng phát biểu tại hội nghị ra mắt mô hình AI quy mô lớn của công ty ở Bắc Kinh (Trung Quốc) ngày 14-3-2024 - Ảnh: Zhipu AI
Theo báo SCMP, ngày 15-1, Zhipu AI cho biết mô hình tạo ảnh GLM-Image của hãng được huấn luyện 100% bằng hệ thống chip nội địa do Huawei Technologies phát triển, trở thành mô hình mã nguồn mở mạnh đầu tiên của Trung Quốc không sử dụng bất kỳ chip Mỹ nào trong toàn bộ quá trình.
Theo Zhipu, toàn bộ chu trình huấn luyện GLM-Image từ xử lý dữ liệu, tinh chỉnh mô hình đến lần chạy huấn luyện cuối cùng đều được thực hiện trên máy chủ Ascend Atlas 800T A2 của Huawei, sử dụng bộ xử lý AI Ascend do Huawei tự phát triển.
Zhipu AI, công ty có trụ sở tại Bắc Kinh, vừa hoàn tất đợt IPO tại Hong Kong, cho rằng thành tựu này chứng minh tính khả thi của việc phát triển các mô hình AI đa phương thức tiên tiến mà không cần đến chip bán dẫn của Mỹ.

Lãnh đạo công ty trí tuệ nhân tạo Zhipu AI, hãng bán dẫn Shanghai Iluvatar CoreX và công ty robot phẫu thuật Shenzhen Edge Medical dự lễ niêm yết tại Sở Giao dịch chứng khoán Hong Kong (HKEX), ngày 8-1 - Ảnh: REUTERS
"Chúng tôi hy vọng kết quả này sẽ trở thành tài liệu tham khảo có giá trị cho cộng đồng, qua đó khai phá tiềm năng của năng lực tính toán nội địa", Zhipu AI tuyên bố.
Trong bối cảnh Mỹ áp đặt hàng loạt biện pháp hạn chế xuất khẩu các dòng chip AI cao cấp sang Trung Quốc, Bắc Kinh đang thúc đẩy mạnh mẽ chiến lược tự chủ công nghệ, đặc biệt trong lĩnh vực trí tuệ nhân tạo - ngành được xem là động lực then chốt cho tăng trưởng kinh tế và cạnh tranh công nghệ toàn cầu.
Theo Zhipu, GLM-Image đạt điểm số dẫn đầu ngành trong nhóm các mô hình mã nguồn mở, đặc biệt ở khả năng hiển thị văn bản trong hình ảnh và tạo chữ Hán, một thách thức kỹ thuật lớn đối với các mô hình tạo ảnh hiện nay.
Các mô hình AI đa phương thức, có khả năng xử lý đồng thời văn bản, giọng nói, hình ảnh và video, đang được giới chuyên gia đánh giá là "biên giới tiếp theo" của trí tuệ nhân tạo. Đây cũng là lĩnh vực mà các ông lớn công nghệ toàn cầu đang chạy đua quyết liệt.
Zhipu cho biết GLM-Image sử dụng kiến trúc lai, kết hợp giữa mô hình tự hồi quy (autoregressive) và mô hình khuếch tán (diffusion).
Thiết kế này cho phép mô hình vừa tạo hình ảnh chất lượng cao vừa xử lý văn bản chính xác - hướng tiếp cận từng được Google DeepMind áp dụng với các mô hình đa phương thức tiên tiến.
Động thái của Zhipu AI được xem là tín hiệu cho thấy hệ sinh thái AI nội địa của Trung Quốc đang từng bước trưởng thành, trong bối cảnh nước này phải tìm con đường phát triển độc lập trước các rào cản công nghệ từ bên ngoài.
Tối đa: 1500 ký tự
Hiện chưa có bình luận nào, hãy là người đầu tiên bình luận