Sau nửa năm, DeepSeek của Trung Quốc có làm thay đổi ngành AI?

DeepSeek, mô hình AI của Trung Quốc, đã gây chấn động thị trường khi chứng minh rằng có thể tạo ra một mô hình mạnh mẽ với chi phí thấp.

DeepSeek - Ảnh 1.

DeepSeek đã chứng minh rằng việc phát triển một mô hình AI hiệu quả không cần những khoản đầu tư khổng lồ - Ảnh: REUTERS

Đã 6 tháng trôi qua kể từ khi DeepSeek gây chấn động thế giới. Ngày nay, ứng dụng được xem là đột phá của Trung Quốc không còn là chủ đề nóng nữa. Nhưng điều đó không có nghĩa là nó sẽ biến mất.

Theo BBC, dù không có số liệu chính xác nhưng nhiều người Mỹ vẫn đang tiếp tục sử dụng DeepSeek. Một số công ty khởi nghiệp ở Thung lũng Silicon đã chọn dùng DeepSeek thay vì các mô hình AI đắt đỏ hơn của Mỹ để tiết kiệm chi phí.

DeepSeek làm thay đổi nhận thức về AI

Trong nhiều năm, các gã khổng lồ công nghệ Mỹ như OpenAI đã dẫn đầu cuộc đua AI với quan điểm "lớn hơn là tốt hơn", tức là mô hình càng lớn, càng nhiều dữ liệu và càng nhiều tài nguyên tính toán thì càng thông minh. 

Điều này đã dẫn đến một cuộc chạy đua tốn kém, tiêu tốn hàng tỉ đô la để xây dựng các trung tâm dữ liệu khổng lồ và mua sắm những con chip đắt đỏ nhất.

DeepSeek đã phá vỡ quan điểm này với chi phí phát triển chỉ khoảng 5,6 triệu USD, trong khi hiệu suất ngang ngửa, thậm chí vượt trội trong một số tiêu chí so với các mô hình của phương Tây. 

Điều này được xem là một minh chứng rõ ràng cho việc "kỹ thuật thông minh hơn" có thể tạo ra hiệu quả vượt trội. 

Một trong những yếu tố kỹ thuật giúp DeepSeek làm được điều này là sử dụng kiến trúc "Mixture-of-Experts" (MoE), cho phép mô hình chỉ kích hoạt những phần cần thiết nhất cho một tác vụ cụ thể, giúp tiết kiệm đáng kể tài nguyên.

Sự kiện DeepSeek đã tạo ra một làn sóng chấn động trên thị trường chứng khoán. Việc cổ phiếu của Nvidia bốc hơi 600 tỉ USD trong một ngày đã cho thấy sự nhạy cảm của thị trường đối với bất kỳ thay đổi nào trong cán cân quyền lực AI. 

Sự kiện này đã buộc các nhà đầu tư phải xem xét lại giá trị của các công ty chip và công nghệ AI, vốn được định giá cao nhờ vào niềm tin cuộc đua "đổ tiền tấn" để xây dựng các mô hình lớn.

Vị thế của Trung Quốc trong cuộc đua AI

Về mặt địa chính trị, DeepSeek đã làm thay đổi nhận thức về vị thế của Trung Quốc trong cuộc đua AI. 

Trước đó, Trung Quốc thường được coi là bên "bám đuổi", nhưng DeepSeek đã cho thấy tiềm năng thực sự của các công ty công nghệ Trung Quốc. Nó đã thúc đẩy Chính phủ Mỹ và các công ty công nghệ phải tăng cường nỗ lực để duy trì vị thế dẫn đầu.

Các tuyên bố của chính quyền Tổng thống Trump về tầm quan trọng của việc "Mỹ tiếp tục là cường quốc thống trị về AI" sau đó cũng cho thấy DeepSeek đã trở thành một biểu tượng của sự cạnh tranh giữa hai siêu cường.

Tuy nhiên, sự thành công của DeepSeek cũng đi kèm với những lo ngại sâu sắc về an ninh dữ liệu. Việc DeepSeek có trụ sở tại Trung Quốc và chính sách quyền riêng tư cho thấy dữ liệu người dùng có thể được lưu trữ và xử lý tại đây đã khiến nhiều công ty và người dùng cá nhân lo ngại. 

Nhiều người đã tìm cách chạy mô hình này trên thiết bị của riêng họ để tránh rủi ro dữ liệu bị chia sẻ một cách bí mật.

Tương lai của AI: Hồi sinh hay quay về lối cũ?

Sau sự ra đời của DeepSeek, ngành AI đã có những chuyển biến rõ rệt. OpenAI đã bất ngờ phát hành hai mô hình miễn phí và mã nguồn mở, động thái được nhiều người coi là sự thừa nhận rằng các mô hình nhỏ hơn, hiệu quả hơn cũng có vai trò quan trọng. 

Dù vậy, cùng lúc đó, OpenAI vẫn tiếp tục theo đuổi GPT-5, một mô hình lớn hơn nữa, cho thấy xu hướng "đổ tiền tấn" vẫn còn rất mạnh mẽ.

Sự phục hồi và tăng trưởng của cổ phiếu Nvidia, đạt mức cao kỷ lục, càng củng cố cho quan điểm rằng cuộc đua "lớn là tốt" vẫn chưa kết thúc. Các công ty như Meta cũng đang đầu tư hàng tỉ đô la vào AI và cạnh tranh giành nhân tài với những gói lương lên tới 100 triệu USD. 

Mặc dù DeepSeek đã chứng minh một hướng đi mới đầy hứa hẹn, nhưng những gã khổng lồ công nghệ vẫn tin vào con đường cũ là nhiều trung tâm dữ liệu hơn, nhiều chip hơn và nhiều năng lượng hơn.

Cuối cùng, ngay cả DeepSeek cũng đang đối mặt với những thách thức. Theo giáo sư Marina Zhang của Đại học Công nghệ Sydney, mô hình tiếp theo của DeepSeek, DeepSeek-R2, đã bị trì hoãn do thiếu chip cao cấp. 

Điều này cho thấy ngay cả một công ty có phương pháp tiếp cận hiệu quả cũng không thể hoàn toàn thoát khỏi những thách thức về nguồn cung phần cứng, một rào cản lớn trong bối cảnh địa chính trị phức tạp hiện nay.

Theo BBC, DeepSeek đã tạo ra một cú sốc cần thiết, buộc ngành công nghiệp AI phải suy nghĩ lại về các giả định cơ bản. Nó đã mở ra một cuộc tranh luận về hiệu quả và chi phí, và đã chứng minh rằng sự đổi mới có thể đến từ bất cứ đâu.

Tuy nhiên, dường như con đường truyền thống của các công ty AI phương Tây vẫn đang chiếm ưu thế.

Sau nửa năm, DeepSeek của Trung Quốc có làm thay đổi ngành AI? - Ảnh 4.Cơn sốt AI tại Trung Quốc: DeepSeek phủ sóng khắp mọi nơi

Kể từ khi ra mắt, mô hình AI DeepSeek đã được hàng loạt công ty Trung Quốc, từ các nhà sản xuất ô tô đến các hãng thiết bị gia dụng, tích hợp vào sản phẩm và dịch vụ của họ.

Trở thành người đầu tiên tặng sao cho bài viết 0 0 0

Tuổi Trẻ Online Newsletters

Đăng ký ngay để nhận gói tin tức mới

Tuổi Trẻ Online sẽ gởi đến bạn những tin tức nổi bật nhất

Bình luận (0)
thông tin tài khoản
Được quan tâm nhất Mới nhất Tặng sao cho thành viên