Cách đây vài tháng, OpenAI đã gây chú ý lớn với Sora, công cụ A có thể tạo ra các video chi tiết và sống động chỉ với vài lời nhắc văn bản. Trong khi công cụ đó vẫn đang trong giai đoạn thử nghiệm đóng, Google đã quyết định công bố trình tạo video dựa trên AI của riêng mình.
Tại hội nghị dành cho nhà phát triển Google I/O 2024, công ty đã giới thiệu Veo, đến từ nhóm nghiên cứu AI Deepmind. Veo tạo ra video chất lượng cao với độ phân giải 1080p trong nhiều phong cách điện ảnh và hình ảnh khác nhau, có thể kéo dài hơn một phút.
"Với khả năng hiểu ngôn ngữ tự nhiên và ngữ nghĩa hình ảnh tiên tiến, Veo tạo ra video phản ánh chặt chẽ tầm nhìn sáng tạo của người dùng - thể hiện chính xác giọng điệu của lời nhắc và hiển thị chi tiết trong các lời nhắc dài hơn", Google cho biết trong bài đăng trên blog.
Mô hình đằng sau Veo có thể hiểu các thuật ngữ điện ảnh và điện ảnh cụ thể khi người dùng nhập chúng, chẳng hạn như "tua nhanh thời gian" hoặc "cảnh quay trên không của một khu vực".
Google DeepMind đã đăng một video được tạo bằng Veo lên kênh YouTube của mình hôm nay. Video cho thấy cảnh quay trên cao của một thành phố lấp lánh ánh đèn neon trước khi chuyển sang cảnh một chiếc ô tô chạy qua thành phố đó. Video kết thúc bằng việc chiếc xe và thành phố chuyển sang một đoạn phim chân thực hơn. Video cũng hiển thị các lời nhắc văn bản được sử dụng để tạo clip Veo mẫu.
Đoạn video được tạo bằng công cụ Veo của Google
Ngoài ra, Google cũng chia sẻ những đoạn clip ngắn hơn về sự sống dưới đáy biển, hay một người đàn ông đang cưỡi ngựa trên đồng cỏ.
Hiện tại, chưa có thông tin về thời điểm Veo sẽ được cung cấp rộng rãi. Tuy nhiên, Google cho biết họ đang tích cực phát triển để đưa các tính năng của Veo vào VideoFX, công cụ dành cho người sáng tạo video YouTube Shorts.