-
09 януари 2025 11:47
- 6240
- 2
Илон Мъск се присъедини към други експерти по изкуствен интелект с твърдението, че са останали малко реални данни, върху които могат да се обучават AI моделите, разработвани от множество компании.
„Изчерпахме почти целия натрупан обем от човешки знания за обучение на AI. Това се случи основно миналата година”, каза Мъск по време на разговор с председателя на Stagwell Марк Пен, излъчен в социалната мрежа X.
Мъск, собственик на компанията xAI, повтори идеите, които бившият главен учен на OpenAI Иля Суцкевер очерта на конференцията за машинно обучение NeurIPS през декември. Суцкевер обяви, че AI индустрията е достигнала „пикови данни” и прогнозира, че липсата на данни за обучение ще наложи промени в съществуващите подходи за разработване на AI модели.
Мъск, от своя страна, предлага решение на този проблем: използване на синтетични данни, генерирани от самите AI модели. „Единственият начин за допълване на реалните данни са синтетичните данни, при които AI сам създава обучителни материали. Със синтетични данни AI ще се самооцени и ще премине през процес на самообучение”, казва той.
Големите технологични компании, включително Microsoft, Meta, OpenAI и Anthropic, вече използват синтетични данни, за да обучават своите водещи AI модели. Gartner изчислява, че 60% от данните, използвани за AI и аналитични проекти през 2024 г., са синтетично генерирани.
Моделът Phi-4 на Microsoft, който стана с отворен код тази седмица, беше обучен на комбинация от синтетични и реални данни. Подобен подход използва Google за създаване на моделите Gemma. Anthropic също използва синтетични данни, за да разработи една от най-добре представящите си системи, Claude 3.5 Sonnet, а Meta подобри най-новата си серия от модели Llama, използвайки данни, генерирани от AI.
Обучението със синтетични данни има редица предимства, включително ефективност на разходите. Стартъпът Writer твърди, че неговият модел Palmyra X 004, разработен почти изцяло от синтетични източници, струва само $700 000 – в сравнение с приблизително $4,6 милиона за сравним OpenAI модел.
Синтетичния подход има и недостатъци. Някои изследвания предполагат, че синтетичните данни могат да доведат до „колапс на модела”, при който AI става по-малко „креативен” и по-предубеден в своите резултати и това в крайна сметка може сериозно да наруши неговата функционалност. Тъй като моделите създават синтетични данни въз основа на съществуващи данни, всички отклонения и ограничения в оригиналните данни ще бъдат възпроизведени в техните резултати, предупреждават специалистите.
Последвайте канала на
Свързани новини
"Майкрософт" с инвестиция за 3 млрд. долара в проекти за изкуствен интелект в Индия
07 януари 202517:27
Копия на повече от 1000 души са създадени с помощта на изкуствен интелект
06 януари 202511:53
"Майкрософт" инвестира 80 млрд. долара в центрове за данни за изкуствен интелект
04 януари 202515:37
За първи път в света: човешки мозък влезе в диалог с изкуствен интелект чрез невронен интерфейс
03 януари 202519:57
„Човекоподобна интелигентна система“: как агентите с изкуствен интелект променят живота?
27 декември 202416:14
Машината надмина човека: изкуствен интелект проектира ракетен двигател за 3 седмици
25 декември 202407:06
ЦСКА - София чака отговор за любимец на Томаш
Реал Мадрид не сгреши и ще гледаме Ел Класико за Суперкупата
Ман Сити сложи на масата 50 млн. евро за съотборник на Коялипу
Георги Иванов: Не ми е фикс идея да бъда харесван
Невероятно! Милена Тодорова се качи на подиума в Световната купа по биатлон
Георги Бобев в "Интервюто на Sportal.bg": Аби е роден победител
Коментари 2
Добави2025.01.09 | 11:59
Добави коментар
Водещи новини
Премиерът проверява организацията на трафика на "Дунав мост" при Русе
10 януари 202506:20
И днес пътуваме със зелен билет в столичния градски транспорт
10 януари 202506:11
След като десетки села останаха без ток: ЕРП-та представят доклади пред КЕВР
10 януари 202506:36
След спецакцията за рекет и изнудване: Ще повдигне ли прокуратурата обвинения на задържаните
10 януари 202506:13
Напрежение пред Спешна помощ в Сливен заради починал пациент
10 януари 202506:29
Генералното консулство на България в Лос Анджелис предупреждава за замърсяване на водата
10 януари 202506:06
Джо Байдън: Ще покрием 100% от разходите за възстановяване на щетите след пожарите
10 януари 202506:41
Тръмп: Руският президент иска да се срещнем и ние се подготвяме
10 януари 202506:25
Какво време ни очаква днес
10 януари 202506:03
2025.01.09 | 14:23