
Start-up AI DeepSeek của Trung Quốc tung ra phiên bản mới của mô hình AI mã nguồn mở V4 - Ảnh minh hoạ: REUTERS.
Theo Đài CNBC ngày 24-4, Công ty trí tuệ nhân tạo (AI) Trung Quốc DeepSeek công bố bản xem trước (preview) của mô hình ngôn ngữ lớn V4, cho phép người dùng thử nghiệm các tính năng mới.
Tương tự mô hình V3 trước đó, phiên bản mới nhất được phát hành dưới dạng mã nguồn mở, cho phép các nhà phát triển tải về, chạy cục bộ và chỉnh sửa cho phù hợp theo nhu cầu.
Công ty có trụ sở tại TP Hàng Châu cho biết V4 đạt hiệu năng mạnh so với các đối thủ trong nước, đặc biệt ở các tác vụ dựa trên agent (các công cụ giúp AI tự động thực hiện và phối hợp nhiều tác vụ), xử lý tri thức và suy luận.
Mô hình cũng được tối ưu để sử dụng với các công cụ agent phổ biến như Claude Code của Anthropic và OpenClaw.
DeepSeek cho biết V4 có hai phiên bản "pro" và "flash", khác nhau về kích thước.
Theo Hãng tin Reuters, phiên bản "flash" có chi phí thấp hơn. Trong khi đó phiên bản pro của V4 vượt trội các mô hình mã nguồn mở khác trong các bài kiểm tra kiến thức thế giới, chỉ đứng sau Gemini-Pro-3.1 (mô hình mã nguồn đóng của Google).
Các bản xem trước được phát hành nhằm giúp công ty thu thập phản hồi thực tế, song DeepSeek chưa công bố thời điểm hoàn thiện mô hình.
Động thái này diễn ra hơn một năm sau khi công ty giới thiệu mô hình suy luận R1 - sản phẩm từng gây chú ý trên thị trường công nghệ toàn cầu nhờ hiệu suất và hiệu quả, dù được cho là phát triển với chi phí thấp hơn đáng kể so với các đối thủ Mỹ.
Được thành lập năm 2023 và thuộc sở hữu của quỹ đầu tư Trung Quốc High-Flyer Capital Management, DeepSeek thu hút sự chú ý vào cuối năm 2024 với mô hình V3 miễn phí, mã nguồn mở và có thể huấn luyện AI bằng các loại chip không cần quá mạnh với chi phí chỉ bằng một phần so với các mô hình của OpenAI và Google.
Đến tháng 1-2025, công ty tiếp tục ra mắt mô hình suy luận R1, đạt các tiêu chuẩn tương đương hoặc vượt trội hơn nhiều mô hình ngôn ngữ lớn hàng đầu thế giới.
Kể từ đó, dù đã tung ra nhiều bản nâng cấp, chưa sản phẩm nào của DeepSeek tạo được ảnh hưởng tương tự R1.
Công ty hiện đối mặt cạnh tranh gia tăng tại thị trường AI Trung Quốc, với các đối thủ như Alibaba và ByteDance cũng ra mắt mô hình AI mới trong năm nay.
DeepSeek đang hướng tới huy động vốn với mức định giá vượt 20 tỉ USD.
Trang tin The Information cho biết các tập đoàn công nghệ lớn như Alibaba và Tencent đang thảo luận khả năng đầu tư.
Cùng ngày, Tập đoàn Huawei Technologies thông báo hệ thống Ascend dùng chip AI Ascend 950 của hãng sẽ hỗ trợ đầy đủ các phiên bản V4 của DeepSeek, theo Reuters.
Tối đa: 1500 ký tự
Hiện chưa có bình luận nào, hãy là người đầu tiên bình luận