Google ra mắt 4 công cụ AI mới giúp bạn làm phim, tạo nhạc, dựng hình bằng lời nói

(PLO)- Tại sự kiện I/O 2025, Google đã công bố loạt công cụ AI tạo sinh mới, giúp ai cũng có thể trở thành nhà làm phim, họa sĩ hay nhạc sĩ… chỉ bằng vài dòng mô tả.

0:00 / 0:00
0:00
  • Nam miền Bắc
  • Nữ miền Bắc
  • Nữ miền Nam
  • Nam miền Nam

Theo đó, 4 công cụ AI tạo sinh mới bao gồm Veo 3, Imagen 4, Lyria 2 và Flow. Đây là loạt sản phẩm ứng dụng các mô hình AI tiên tiến từ Google DeepMind, cho phép người dùng dễ dàng tạo ra video, hình ảnh, âm nhạc và thậm chí là cả phim điện ảnh một cách nhanh chóng, sống động và giàu tính sáng tạo.

Google ra mắt 4 công cụ AI giúp người dùng làm phim, tạo nhạc... dễ dàng hơn. Ảnh: Google
Google ra mắt 4 công cụ AI giúp người dùng làm phim, tạo nhạc... dễ dàng hơn. Ảnh: Google

1. Veo 3: Làm video bằng AI có âm thanh và đối thoại

Veo 3 là phiên bản mới nhất của mô hình tạo video bằng AI từ Google, nổi bật với khả năng tạo video kèm âm thanh, từ tiếng xe cộ, tiếng chim hót đến lời thoại nhân vật.

Bạn chỉ cần mô tả một ý tưởng đơn giản bằng lời (prompt), Veo 3 sẽ biến nó thành một đoạn phim sống động, với hình ảnh sắc nét và hiệu ứng âm thanh chân thực.

Không chỉ hiểu văn bản tốt hơn, Veo 3 còn mô phỏng vật lý thực tế, đồng bộ khẩu hình với giọng nói và tái hiện các chuyển động camera chính xác. Hiện người dùng gói Gemini Ultra tại Mỹ đã có thể trải nghiệm Veo 3 trên ứng dụng Gemini và nền tảng làm phim mới Flow.

Cùng lúc đó, Google cũng nâng cấp Veo 2, phiên bản tiền nhiệm bằng loạt tính năng chuyên biệt cho nhà làm phim.

2. Flow: Dựng phim bằng AI, kiểm soát từng cảnh quay bằng lời nói

Flow là công cụ làm phim hoàn toàn mới, thiết kế riêng cho các nhà sáng tạo. Được xây dựng dựa trên sức mạnh tổng hợp của các mô hình AI gồm Veo, Imagen và Gemini, Flow cho phép bạn viết lời mô tả để tạo cảnh quay điện ảnh hoàn chỉnh, bao gồm nhân vật, bối cảnh, phong cách và bố cục.

Chỉ bằng giọng nói hoặc văn bản, người dùng có thể tạo ra từng cảnh phim với khả năng kiểm soát chi tiết không thua gì các phần mềm dựng phim chuyên nghiệp. Hiện Flow đã khả dụng cho người dùng gói AI Pro và Ultra tại Mỹ và sẽ sớm ra mắt ở các quốc gia khác.

3. Imagen 4: Tạo hình ảnh 2K, chất lượng in ấn, đánh vần chữ không sai

Imagen 4 mang đến độ chi tiết ấn tượng, từ giọt nước nhỏ cho đến từng sợi lông động vật hay họa tiết vải vóc tinh xảo.

Không chỉ phù hợp với cả phong cách siêu thực lẫn trừu tượng, Imagen 4 còn có khả năng sắp xếp chữ cực chuẩn, rất lý tưởng để tạo thiệp chúc mừng, áp phích hay truyện tranh. Mô hình hỗ trợ tạo ảnh ở nhiều tỉ lệ khung hình khác nhau, độ phân giải lên đến 2K, đủ chất lượng để dùng trong in ấn hoặc thuyết trình.

Hiện Imagen 4 đã được tích hợp vào Gemini, Whisk, Vertex AI và các ứng dụng thuộc Google Workspace như Slides, Vids và Docs. Google cũng hé lộ phiên bản tốc độ cao gấp 10 lần so với Imagen 3 sẽ sớm ra mắt.

4. Lyria 2: Sáng tác nhạc trực tiếp với AI, không giới hạn thể loại

Lyria 2, mô hình AI tạo nhạc mới, giúp người dùng sáng tác bài hát, hòa âm phối khí hoặc tạo hiệu ứng âm thanh một cách linh hoạt và đầy sáng tạo.

Thông qua Music AI Sandbox và công cụ MusicFX DJ, bạn có thể tương tác với AI theo thời gian thực, yêu cầu thay đổi giai điệu, tốc độ, nhạc cụ chỉ bằng vài dòng mô tả. Tính năng này hiện đã mở cho người dùng YouTube Shorts và doanh nghiệp trong Vertex AI.

Chống giả mạo AI

Để bảo vệ người dùng khỏi thông tin giả mạo, Google tích hợp SynthID, công nghệ đánh dấu (watermark) vào tất cả nội dung do các mô hình như Veo 3, Imagen 4 hay Lyria 2 tạo ra. Tính đến nay, hơn 10 tỉ ảnh, video, âm thanh và văn bản đã được gắn dấu.

Không chỉ dành cho nghệ sĩ hay kỹ thuật viên, các công cụ AI tạo sinh mới của Google đang mở ra cánh cửa sáng tạo cho tất cả mọi người. Từ học sinh, nhà sáng tạo nội dung đến doanh nghiệp nhỏ, bất kỳ ai cũng có thể hiện thực hóa ý tưởng của mình thành hình ảnh, âm nhạc hay phim ngắn với chất lượng chuyên nghiệp, nhanh chóng, dễ dàng và đầy cảm hứng.

Đọc thêm

Một sai lầm khiến tài khoản Zalo có nguy cơ rơi vào tay người khác

Một sai lầm khiến tài khoản Zalo có nguy cơ rơi vào tay người khác

(PLO)- Nhiều người sau khi đổi số điện thoại vẫn tiếp tục sử dụng tài khoản Zalo mà không cập nhật thông tin mới. Thói quen này tưởng chừng vô hại nhưng có thể gây ra không ít phiền phức nếu số điện thoại cũ bị nhà mạng thu hồi và cấp lại cho người khác.

Cách ghi âm tốt nhất trên iPhone

Cách ghi âm tốt nhất trên iPhone

(PLO)- Nhiều người sử dụng iPhone để ghi âm cuộc họp, phỏng vấn hoặc lưu lại ý tưởng bất chợt. Tuy nhiên, không phải ai cũng biết rằng ứng dụng Ghi âm (Voice Memos) trên iPhone có sẵn một tính năng giúp cải thiện chất lượng âm thanh chỉ với vài thao tác đơn giản.

20 năm Intel tại Việt Nam: Từ vài trăm nhân sự đến nhà máy xuất khẩu hơn 110 tỉ USD

20 năm Intel tại Việt Nam: Từ vài trăm nhân sự đến nhà máy xuất khẩu hơn 110 tỉ USD

(PLO)- Hai mươi năm sau khi đặt nền móng tại Khu Công nghệ cao TP.HCM, Intel không chỉ vận hành cơ sở lắp ráp và kiểm định chip lớn nhất trong mạng lưới toàn cầu của mình, mà còn trở thành một trong những doanh nghiệp công nghệ có đóng góp lớn nhất cho hoạt động xuất khẩu và đào tạo nhân lực bán dẫn tại Việt Nam.

VNG lần đầu đặt mục tiêu có lãi sau khi lên sàn

VNG lần đầu đặt mục tiêu có lãi sau khi lên sàn

(PLO)- Sau nhiều năm theo đuổi chiến lược tăng trưởng và liên tục mở rộng hệ sinh thái công nghệ, VNG đang bước vào giai đoạn mới khi lần đầu tiên đặt mục tiêu có lãi kể từ khi cổ phiếu VNZ giao dịch trên UPCoM.