Thứ 2, Ngày 14 / 10 / 2024
Công ty Shengshu Technology và Đại học Thanh Hoa (Trung Quốc) đã công bố mô hình trí tuệ nhân tạo Vidu có thể tạo video từ văn bản
Vidu sử dụng kiến trúc Universal Vision Transformer (U-ViT) để tạo ra các video có độ phân giải 1080p và thời lượng 16 giây chỉ trong một cú nhấp chuột. Kiến trúc này cho phép Vidu mô phỏng thế giới vật lý thực với việc tạo ra các cảnh quay từ nhiều góc độ, tạo ra những cảnh quay đa dạng và sinh động. Điểm đáng chú ý là Vidu cũng có khả năng tạo ra nội dung với độ tinh vi và phức tạp, đồng thời duy trì tính nhất quán cao về không gian-thời gian và hiểu biết về các yếu tố văn hóa Trung Quốc.
Trong buổi ra mắt mô hình, Shengshu đã phát hành một số clip demo, bao gồm một clip có cảnh gấu trúc chơi ghi-ta khi ngồi trên bãi cỏ và một clip khác về một chú chó con đang bơi trong hồ, cả hai đều hiển thị các chi tiết sống động.
Trong khi Sora của OpenAI dựa trên kiến trúc diffusion transformer (DiT), cho phép tạo ra các video dài hơn và có mức độ chân thực hơn so với Vidu. Sora đã thu hút sự chú ý lớn khi ra mắt, nhưng Vidu cũng không kém phần ấn tượng. Tuy nhiên, một điểm yếu của Vidu là hiệu suất tính toán. Mặc dù có khả năng tạo ra các video chất lượng cao, công nghệ tính toán tại Trung Quốc hiện vẫn chưa đạt được sức mạnh tính toán cần thiết. Điều này có thể là một vấn đề đáng quan ngại, đặc biệt khi cạnh tranh với các mô hình như Sora đòi hỏi sức mạnh tính toán lớn.
Sự ra mắt của Vidu đồng thời mở ra một cuộc cạnh tranh mới giữa các công ty công nghệ của Trung Quốc và Mỹ trong lĩnh vực AI. Khi Mỹ thắt chặt hạn chế xuất khẩu các chip tiên tiến, Trung Quốc đang nỗ lực phát triển các công nghệ AI riêng của mình để đạt được vị thế dẫn đầu toàn cầu vào năm 2030. Việc các công ty Trung Quốc như Shengshu đầu tư mạnh mẽ vào nghiên cứu và phát triển AI là minh chứng rõ ràng cho sự quyết tâm của họ trong cuộc đua này.
Sự ra mắt của Vidu không chỉ là một bước tiến mới trong lĩnh vực AI, mà còn là điểm nhấn cho cuộc cạnh tranh sôi động giữa các quốc gia và các công ty công nghệ hàng đầu trên thế giới. Mặc dù vẫn còn những thách thức phải vượt qua, nhưng sự cạnh tranh này sẽ tiếp tục thúc đẩy sự phát triển của AI và mang lại những ứng dụng mới mẻ và đổi mới cho xã hội.