Whisper беше похвалена за способността си да се справя с различни акценти и диалекти, използвайки широкомащабни набори от данни за обучение.
VideoLAN, организацията с нестопанска цел зад VLC Media Player, обяви в презентация на CES 2025, че популярният мултимедиен инструмент с отворен код е достигнал крайъгълен камък от 6 милиарда изтегляния.
Въпреки че това постижение е доста значително, цифрата може да е консервативна, тъй като компанията вероятно е изключила броя на изтеглянията от източници на трети страни.
Интересното е, че предстоящата функция за субтитри, задвижвана от ИИ, на VLC изглежда се вдъхновява от напредъка на програми като Whisper на OpenAI. Това е система за автоматично разпознаване на реч (ASR), предназначена да транскрибира аудио в текст.
VideoLAN все още не е потвърдила официална дата на пускане на новата функция, въпреки че се очаква да стартира като безплатна актуализация в близко бъдеще. Допълнителни подробности ще бъдат споделени чрез блога на компанията.
Субтитрирането с изкуствен интелект също може да обработва различни медийни формати, което го прави основен инструмент за потребители, които искат да се насладят на съдържание на различни езици без външен софтуер. Според компанията AI ще може да генерира субтитри и преводи за видеоклипове на над 100 езика, правейки VLC по-достъпен за глобалната аудитория, пише hicomm.bg.
Въпреки това VLC използва различен подход, при който ИИ моделите ще работят офлайн, вградени директно в приложението VLC. Тази функция е особено забележителна, тъй като елиминира необходимостта от интернет връзка или зависимостта от базирани на облак услуги, които често са проблем за потребителите, които се грижат за поверителността.
Заедно с това, разработчиците от VideoLAN обявиха бъдещите си планове с представянето на следващата им голяма функция: субтитри, задвижвани от изкуствен интелект и превод в реално време за 100 езика. Функцията в момента е в процес на разработка и е предназначена за създаване на субтитри в реално време с помощта на модели с изкуствен интелект с отворен код.
)