OpenAI направи огромен фурор тази седмица със своя нов AI инструмент за генериране на видео по текст - Sora. Компанията показа някои наистина впечатляващи примерни клипове. Компанията на Сам Алтман вече нарича Sora "симулатор на светове", способен да разбере важни аспекти на триизмерния свят около нас.
"Нашите резултати предполагат, че мащабирането на модели за генериране на видео е обещаващ път към изграждането на симулатори с общо предназначение на физическия свят", пише компанията.
"Той сам изучава 3D геометрията", каза изследователят Тим Брукс пред Wired. "Не сме подготвили това, алгоритъмът сам го научи от виждането на много данни."
За да обучи Sora, OpenAI го захранва с огромно количество видеоклипове с надписи, за да установи връзка между видеозаписи и въвеждане на текст. Освен генерирането на изцяло нови кадри от подкани, Sora може също така да разшири съществуващите клипове или да превърне изображения, генерирани от AI, във видео. Докато разработваха Sora, изследователите на OpenAI наблюдаваха "редица интересни възникващи способности".
Генерираните клипове показват, че Sora може да генерира кадри с динамични и удивително плавни смени на камерата, докато се движи, проследява или мащабира, демонстрирайки значителна степен на очевидно разбиране на 3D пространствата.
Това отваря възможността изкуственият интелект да се използва и като симулатор. В бъдеще той може да участва в направата на видео игри и филми, революционизирайки процеса по създаването им, пише dir.bg.
В същото време Sora далеч не е съвършен. Първо, моделът все още не разбира напълно причината и следствието. "Например, човек може да отхапе бисквитка, но след това бисквитката може да няма следа от ухапване", пише компанията.
И OpenAI е изключително наясно с потенциала за злоупотреба с технологията. В резултат на това компанията избра да забави дебюта на Sora.