Sora - Ai tạo video của OpenAi gây choáng ngợp người dùng

19 / 02 / 2024 508 lượt xem

Vào ngày 16/2, OpenAI đã giới thiệu một công nghệ trí tuệ nhân tạo (AI) mới có tên là Sora, cho phép tạo video từ văn bản ở mức độ thử nghiệm. Ban đầu, công nghệ này chỉ được chia sẻ với một nhóm người dùng nhỏ để thu thập thông tin về các lỗi và nguy cơ tiềm ẩn.
Đáng chú ý, Sora tạo ra những đoạn video với một mức độ chân thật đáng kinh ngạc. Công nghệ này có thể tạo ra các video dài lên đến một phút và vẫn giữ được chất lượng hình ảnh đồng thời đáp ứng yêu cầu của người dùng.
Trên trang web của mình, OpenAI cho biết: "Chúng tôi đang huấn luyện AI để nắm vững và mô phỏng thành công thế giới vật lý trong các tình huống chuyển động".

Câu lệnh: Một người phụ nữ đi dạo trên đường phố Tokyo đầy ánh sáng neon ấm áp. Cô ấy mặc một chiếc áo khoác da màu đen, một chiếc váy dài màu đỏ, đi đôi bốt màu đen và cầm một chiếc túi xách màu đen. Cô gái đeo kính râm và dùng son môi màu đỏ. Dáng đi tự tin và thoải mái. Con phố ẩm ướt và phản chiếu, tạo ra hiệu ứng gương với ánh sáng đầy màu sắc. Nhiều người đi bộ xuất hiện trên đường. Video: OpenAI
Vào tháng 4/2023, công ty khởi nghiệp Runway AI ở New York đã giới thiệu một công nghệ cho phép người dùng tạo video chỉ bằng cách gõ một câu lệnh. Tuy nhiên, video có thời lượng ngắn - 4 giây - thường bị nhòe, giật gân và méo mó.
Chỉ sau 10 tháng, OpenAI đã giới thiệu một công nghệ tương tự nhưng có khả năng tạo ra những video chất lượng cao, giống như trong một bộ phim Hollywood.
Trong chiến dịch ra mắt, OpenAI cho biết: "Sora có khả năng tạo ra các cảnh phức tạp với nhiều nhân vật. Chuyển động của các thể hiện và khung cảnh có thể được tái hiện chính xác đến từng chi tiết. Mô hình không chỉ hiểu yêu cầu trong văn bản, mà còn hiểu cách những yếu tố đó tương tác trong thế giới vật lý".
Đây là một tiến bộ đáng kể trong công nghệ tạo ra hình ảnh và video từ văn bản. Công nghệ này giúp tăng tốc độ làm việc của các nhà làm phim và có tiềm năng thay thế hoàn toàn các nghệ sĩ kỹ thuật số không có nhiều kinh nghiệm.

Câu lệnh: Trong cảnh quan tuyết phủ của một cánh đồng, một bầy voi khổng lồ với bộ lông dày đang chạy qua. Bộ lông nhẹ nhàng bay trong gió khi chúng di chuyển. Cảnh quan xung quanh bao gồm cây cối và những ngọn núi xa xa, đều được phủ bởi tuyết trắng. Ánh sáng ban ngày chiếu rọi xuống, với những đám mây nhẹ và mặt trời cao tạo nên hiệu ứng ánh sáng ấm áp. Góc quay thấp trong video chụp lại vẻ đẹp của bộ lông voi và tạo ra một tiêu cự sâu. Video: OpenAI.
Tuy nhiên, Sora vẫn có một số hạn chế. OpenAI đã cảnh báo rằng mô hình có thể gặp khó khăn trong việc mô phỏng chính xác các phân cảnh phức tạp và không hiểu rõ nguyên nhân và hậu quả. Điều này có thể dẫn đến những kết quả không chính xác hoặc không logic. Ngoài ra, mô hình cũng có thể gây nhầm lẫn về chi tiết không gian và thời gian trong câu lệnh.
Một điều đáng lo ngại là Sora có thể trở thành một công cụ tạo ra thông tin sai lệch và hình ảnh không chính xác một cách nhanh chóng. Điều này có thể gây khó khăn cho người dùng trong việc phân biệt sự thật và giả mạo trên internet.
Hiện tại, OpenAI chưa công bố công nghệ Sora cho công chúng và đang tiếp tục nghiên cứu để hiểu rõ hơn về những nguy cơ tiềm ẩn của hệ thống. Công ty đang làm việc với một nhóm nhỏ các nhà nghiên cứu và chuyên gia bên ngoài để "kiểm tra và thử thách" công nghệ mới này.

Công nghệ Sora, được phát triển bởi nhóm nghiên cứu gồm Tim Brooks và Bill Peebles, đã được đặt tên theo từ "sora" trong tiếng Nhật, có nghĩa là "bầu trời", với ý tưởng về tiềm năng sáng tạo không giới hạn. OpenAI là công ty đứng sau các dự án như chatbot ChatGPT và công cụ tạo hình ảnh DALL-E.
Hiện tại, OpenAI đã gắn nhãn các video được tạo ra bởi Sora để giúp người dùng phân biệt chúng. Tuy nhiên, công ty cũng nhận thức rằng nhãn dán có thể dễ dàng bị loại bỏ và khó phát hiện.
OpenAI không tiết lộ số lượng và nguồn gốc của các video được sử dụng để đào tạo Sora. Mặc dù các video do Sora tạo ra có thể tạo ấn tượng mạnh, nhưng chúng thường chứa những hình ảnh kỳ lạ và không logic.
Trước khi Sora xuất hiện, đã có sự ra mắt của Midjourney, một công nghệ tương tự. Điều này đã gây ra nhiều tranh cãi và có ảnh hưởng đến ngành công nghiệp, khiến nhiều người mất việc làm.