Sora của OpenAI: Nền tảng tạo video hiện đại với giao diện dễ sử dụng
OpenAI, công ty phát triển ChatGPT, đã chính thức ra mắt Sora – một công cụ trí tuệ nhân tạo (AI) tiên tiến, nhằm hỗ trợ người dùng trong quá trình tạo ra video một cách nhanh chóng và sáng tạo. Sora sử dụng cơ chế tương tự như ChatGPT, cho phép người dùng tương tác với nó thông qua việc đưa ra các lời nhắc (prompt), từ đó Sora sẽ tự động tạo ra nội dung video dựa trên thông tin được cung cấp. Điều này mang lại trải nghiệm sáng tạo và tiện lợi cho những người không có kinh nghiệm chuyên sâu về biên tập video, mở rộng khả năng sáng tạo của cộng đồng người dùng.
Sora, sản phẩm mới trong hệ sinh thái của OpenAI, được xây dựng dựa trên mô hình tạo sinh AI, theo cách hoạt động tương tự như công cụ tạo ảnh Dall-E của cùng một nhà sản xuất. Với Sora, người dùng có khả năng tạo ra video chất lượng cao chỉ bằng cách đưa ra các lời nhắc về nội dung mong muốn và Sora sẽ tự động tạo ra video tương ứng.
Công cụ này không chỉ giới hạn ở việc tạo video từ các lời nhắc, mà còn có khả năng tạo video từ hình ảnh tĩnh, kéo dài video hoặc điền vào các khung hình trống. Sự linh hoạt của Sora mang lại cho người dùng nhiều lựa chọn và tiện ích trong quá trình sáng tạo nội dung video.
Tích hợp công nghệ tạo sinh AI vào lĩnh vực video mở ra một hướng đi mới cho phát triển của trí tuệ nhân tạo. Tuy nhiên, cùng với sự chào đón của cộng đồng người hâm mộ AI, sự xuất hiện của trí tuệ nhân tạo cũng đáng lo ngại về việc sử dụng phải thông tin sai lệch trong bầu cử khi các cuộc bầu cử chính trị toàn cầu chuẩn bị diễn ra. Theo dữ liệu từ công ty máy học Clarity, số lượng video deepfake do AI tạo ra đã tăng đáng kể, lên đến 900% so với năm trước, tăng cường nỗi lo ngại về thách thức mới trong bảo vệ sự chân thực và truyền thông đáng tin cậy.
OpenAI đặt mình vào cuộc đua cạnh tranh cùng các đối thủ mạnh mẽ như Meta, Google và một số startup nổi bật như Stability AI trong lĩnh vực công cụ AI tạo video với phần mềm Sora. Cũng không kém phần đáng chú ý, Amazon đã ra mắt Create with Alexa, một mô hình chuyên tạo nội dung hoạt hình ngắn dành cho trẻ em dựa trên các lời nhắc.
Hiện tại, Sora chỉ có khả năng tạo ra các video có độ dài tối đa một phút, tuy nhiên, với đội ngũ “đội đỏ” đã được thành lập để thực hiện việc kiểm thử bảo mật và phát hiện các lỗ hổng có thể xuất hiện trong hệ thống. OpenAI vẫn chưa công bố bản demo công khai nào, chỉ giới thiệu 10 video mẫu trên trang web để giới thiệu khả năng của Sora. Điều này thể hiện sự cẩn trọng và tập trung vào việc kiểm soát chất lượng và an ninh trước khi mở rộng sự tiếp cận của công cụ này đến cộng đồng người dùng rộng lớn.
OpenAI hiện đang phát triển một bộ phân loại có khả năng nhận diện video clip được tạo ra bởi Sora và có kế hoạch tích hợp một số siêu dữ liệu đặc biệt vào kết quả đầu ra để hỗ trợ việc xác định nội dung được tạo ra bởi trí tuệ nhân tạo. Điều này giống như nỗ lực của Meta trong việc xác định hình ảnh do trí tuệ nhân tạo tạo ra.
Sora, giống như ChatGPT, sử dụng kiến trúc Transformer mà các nhà nghiên cứu của Google giới thiệu trong một bài báo năm 2017. Kiến trúc này đã trở thành một cơ sở quan trọng cho nhiều mô hình trí tuệ nhân tạo, đặc biệt là trong lĩnh vực xử lý ngôn ngữ tự nhiên. Điều này cho thấy sự liên kết vững chắc với các công nghệ tiên tiến và đã được kiểm chứng trong cộng đồng nghiên cứu.