Настъпва ли повратен момент в медийното пространство и начина, по който възприемаме информацията и въобще света около нас?
Този път е различно
Изследователи от китайската компания ByteDance, собственик на TikTok, показаха нова AI система - OmniHuman-1, която може да генерира най-реалистичните дийпфейк видеоклипове до момента.
Но повечето дийпфейкове – и по-специално видео фалшификатите – не успяват да изчистят всички детайли на подмяната. Обикновено има някакъв признак или очевиден знак, че е замесен изкуственият интелект, отбелязва TechCrunch.
Обучен на 19 000 часа видео съдържание от неразкрити източници, OmniHuman-1 може също да редактира съществуващи видеоклипове – дори да променя движенията на крайниците на човек. Наистина е удивително колко убедителен може да бъде резултатът.
Дълбокият фалшификат, направен с изкуствен интелект, вече е стока. Има достатъчно приложения, които могат да вмъкнат някого в снимка или да накарат човек да изглежда, че каже нещо, което всъщност не е казал.
И все пак, OmniHuman-1 е с глави и рамене над предишните техники за дълбоки фалшификати и може да е знак за предстоящи големи неща. Въпреки че ByteDance не е пуснала системата за публично ползване, на AI общността едва ли ще отнеме много време за „обратно инженерство” на модели като тези.
Не е така обаче с OmniHuman-1 – поне от избраните образци, които екипът на ByteDance разпространи, намесата на AI не се забелязва. Можем да видим измислено изпълнение на Тейлър Суифт, TED лекция, която никога не се е състояла, дълбоко фалшифицирана лекция на Айнщайн…
Разбира се, OmniHuman-1 не е перфектен. Екипът на ByteDance казва, че референтните изображения с „ниско качество” няма да доведат до най-добрите видеоклипове и изглежда, че системата се бори с определени пози – наблюдават се, например, странни жестове с чашата за вино в едно от видеата.
Според разработчиците от ByteDance, OmniHuman-1 се нуждае само от едно референтно изображение и аудио, като реч или вокали, за да генерира клип с произволна дължина. Съотношението на изходния видеоклип е регулируемо, както и „пропорцията на тялото” на субекта – т.е. каква част от тялото му е показано във фалшивите кадри.
)