OpenAI giới thiệu Sora, mô hình AI chuyển văn bản thành video

(PLO)- Sora là mô hình AI có thể tạo ra những video chân thực, giàu trí tưởng tượng từ những hướng dẫn bằng văn bản.

0:00 / 0:00
0:00
  • Nam miền Bắc
  • Nữ miền Bắc
  • Nữ miền Nam
  • Nam miền Nam

Mới đây, OpenAI (công ty mẹ của ChatGPT) đã tung ra một mô hình tạo video mới có tên là Sora. Mô hình AI này cho phép chuyển văn bản thành video chân thực dài tối đa một phút, tất cả đều dựa trên lời nhắc của người dùng.

Theo bài giới thiệu trên blog của OpenAI, Sora có khả năng tạo ra “những cảnh phức tạp với nhiều nhân vật, các kiểu chuyển động cụ thể cũng như các chi tiết chính xác về chủ đề và bối cảnh”. Công ty cũng lưu ý rằng mô hình này có thể hiểu cách các vật thể “tồn tại trong thế giới vật chất” cũng như “diễn giải chính xác các đạo cụ và tạo ra các nhân vật hấp dẫn thể hiện cảm xúc sống động”.

Một đoạn video được tạo bởi Sora. Nguồn: OpenAI

Sora cũng có thể tạo video dựa trên hình ảnh tĩnh cũng như điền vào các khung hình còn thiếu trên video hiện có hoặc mở rộng video đó. Các bản demo do Sora tạo có trong bài đăng trên blog của OpenAI bao gồm cảnh trên không của California trong cơn sốt vàng, một video trông như thể được quay từ bên trong một chuyến tàu ở Tokyo và các video khác.

OpenAI cho biết mô hình AI Sora có thể gặp khó khăn trong việc mô phỏng chính xác tính chất vật lý của một cảnh phức tạp, nhưng kết quả nhìn chung khá ấn tượng.

Đoạn phim lịch sử về California trong cơn sốt vàng được tạo bởi Sora. Ảnh chụp màn hình
Đoạn phim lịch sử về California trong cơn sốt vàng được tạo bởi Sora. Ảnh chụp màn hình

Trong thời gian gần đây, các công cụ AI hỗ trợ biến văn bản thành video ngày càng được quan tâm, đơn cử như Runway, Pika và Lumiere của Google. Tương tự như Sora, Lumiere cung cấp cho người dùng công cụ chuyển văn bản thành video và phép họ tạo video từ hình ảnh tĩnh.

Sora hiện chỉ dành cho một số ít người dùng thử nghiệm, đánh giá về mô hình và những tác hại, rủi ro tiềm ẩn. OpenAI cũng cung cấp quyền truy cập cho một số nghệ sĩ thị giác, nhà thiết kế và nhà làm phim để nhận phản hồi.

Đầu tháng này, OpenAI đã thông báo rằng họ sẽ thêm watermark vào công cụ chuyển văn bản thành hình ảnh DALL-E 3, nhưng lưu ý rằng chúng có thể “dễ dàng xóa bỏ”. Giống như các sản phẩm AI khác, Sora sẽ phải đối mặt với hậu quả của việc các video do AI tạo ra bị nhầm lẫn với video thật.

cong-cu-dall-e.jpeg
Công cụ tạo hình ảnh từ văn bản DALL-E của OpenAI. Ảnh: TIỂU MINH

Đọc thêm

Một sai lầm khiến tài khoản Zalo có nguy cơ rơi vào tay người khác

Một sai lầm khiến tài khoản Zalo có nguy cơ rơi vào tay người khác

(PLO)- Nhiều người sau khi đổi số điện thoại vẫn tiếp tục sử dụng tài khoản Zalo mà không cập nhật thông tin mới. Thói quen này tưởng chừng vô hại nhưng có thể gây ra không ít phiền phức nếu số điện thoại cũ bị nhà mạng thu hồi và cấp lại cho người khác.

Cách ghi âm tốt nhất trên iPhone

Cách ghi âm tốt nhất trên iPhone

(PLO)- Nhiều người sử dụng iPhone để ghi âm cuộc họp, phỏng vấn hoặc lưu lại ý tưởng bất chợt. Tuy nhiên, không phải ai cũng biết rằng ứng dụng Ghi âm (Voice Memos) trên iPhone có sẵn một tính năng giúp cải thiện chất lượng âm thanh chỉ với vài thao tác đơn giản.

20 năm Intel tại Việt Nam: Từ vài trăm nhân sự đến nhà máy xuất khẩu hơn 110 tỉ USD

20 năm Intel tại Việt Nam: Từ vài trăm nhân sự đến nhà máy xuất khẩu hơn 110 tỉ USD

(PLO)- Hai mươi năm sau khi đặt nền móng tại Khu Công nghệ cao TP.HCM, Intel không chỉ vận hành cơ sở lắp ráp và kiểm định chip lớn nhất trong mạng lưới toàn cầu của mình, mà còn trở thành một trong những doanh nghiệp công nghệ có đóng góp lớn nhất cho hoạt động xuất khẩu và đào tạo nhân lực bán dẫn tại Việt Nam.

VNG lần đầu đặt mục tiêu có lãi sau khi lên sàn

VNG lần đầu đặt mục tiêu có lãi sau khi lên sàn

(PLO)- Sau nhiều năm theo đuổi chiến lược tăng trưởng và liên tục mở rộng hệ sinh thái công nghệ, VNG đang bước vào giai đoạn mới khi lần đầu tiên đặt mục tiêu có lãi kể từ khi cổ phiếu VNZ giao dịch trên UPCoM.