AI модели, пуснати през 2025 г.
Alibaba Qwen QwQ-32B-Preview
Anthropic’s Claude Sonnet 3.5
Anthropic’s Computer Use Claude’s
DeepSeek R1
Gemini Deep Research
Google Gemini 2.0 Pro Experimental
Meta Llama 3.3 70B
Mistral Le Chat
OpenAI Deep Research
OpenAI GPT 4o-mini
OpenAI o1
OpenAI o3-mini
OpenAI Operator
OpenAI Sora
x.AI’s Grok 2
xAI’s Grok 3 Grok 3 е последният флагмански модел на стартиращата компания xAI, основана от Илон Мъск. Счита се, че той надминава други водещи модели в области като математика, наука и програмиране. Моделът изисква X Premium абонамент (който е $50 на месец).
В момента броят на моделите с изкуствен интелект надвишава 1 милион. Например, Hugging Face хоства над 1,4 милиона.
Допълнителна трудност възниква и защото AI моделите често се популяризират на база индустриални бенчмарк показатели. Техническите метрики често, обаче, не разкриват начина, по който те реално се използват от хората и компаниите.
След като проучване установи, че моделът Grok 2 е с ляв политически уклон, Мъск обеща поправи това и да направи своя изкуствен интелект „политически неутрален“. Дали това е постигнато - все още остава неясно.
Това е най-новата и най-напреднала версия на отворените AI модели Llama на Meta. Meta твърди, че тази версия е най-евтината и най-ефективната досега, особено при математиката, общите познания и следването на инструкции. Тя е безплатна и с отворен код.
AI модели, пуснати през 2024 г.
TechCrunch публикува списък, който преглежда на най-напредналите AI модели, пуснати след 2024 г. В него са разгледани и насоки за това по какъв начин може да ги използвате и за каква цел са най-подходящи те.
От големите технологични компании като Google до стартъпите като OpenAI и Anthropic, моделите с изкуствен интелект се множат с невъобразима скорост. Именно поради тази причина, да проследите появата на най-новите AI модели може да се окаже изтощаващо занимание.
AI компанията на Илон Мъск, x.AI, пусна подобрена версия на флагманския си Grok 2 чатбот, който твърди, че е „три пъти по-бърз“. Безплатните потребители са ограничени до 10 въпроса на всеки два часа в Grok, докато абонатите на X’s Premium и Premium+ планове се радват на по-високи лимити на използване. x.AI пусна и генератор на изображения, Aurora, който създава силно фотореалистични изображения, включително някои графични или насилствени съдържания.
Claude Sonnet 3.5 е модел, за който Anthropic претендира, че е лидер в областта си. Известен е със своите възможности в програмирането и се счита за чатбота, който технологичните експерти най-често избират. Моделът може да разбира изображения, но не може да ги генерира.
Computer Use е предназначен да поеме контрола върху компютъра ви, за да изпълни задачи, свързани с програмиране или резервация на самолетен билет, например. Моделът е предшественик на OpenAI’s Operator. Компютърната употреба, обаче, остава в бета версия. Цените са чрез API: $0.80 на милион токена за вход и $4 на милион токена за изход.
Deep Researchобобщава резултатите от търсенето в Google в опростен документ с подбрани цитати. Услугата е полезна за студенти и като цяло за всеки, който се нуждае от бързо обобщение на изследвания. Въпреки това, имайте предвид, че качеството определено не е на нивото на рецензираните научни статии. Deep Research изисква Google One AI Premium абонамент от $19.99 на месец.
Mistral пусна версии на мултимодалния AI личен асистент - Le Chat. От компанията твърдят, че чатботът им отговаря на заявки и запитвания по-бързо от всеки друг. Има и два варианта за платена версия, като при най-скъпия абонамент се включват и актуални новини от AFP. Тестове на Le Monde показаха, че производителността на Le Chat е впечатляваща, въпреки че допуска повече грешки от ChatGPT.
OpenAI Deep Research е предназначен за задълбочено изследване на теми с ясни цитати. Тази услуга е достъпна само с ChatGPT Pro абонамент от $200 на месец. OpenAI го препоръчва за всичко - от науни дейности до пазарни проучвания. Въпреки това, бъдете нащрек! Халюцинациите остават проблем за изкуствения интелект.
OpenAI възхвалява GPT 4o-mini като най-евтиния и най-бърз модел досега, благодарение на "малкия" си размер. Той има за цел да улесни изпълнението на широк набор от задачи, като например работата на чатботове за обслужване на клиенти. Моделът е наличен в безплатната версия на ChatGPT. Той е по-подходящ за по-прости задачи с по-висока честото висока честота и не толкова за сложни такива.
OpenAI’s Operator е предназначен да бъде личен асистент, който може да изпълнява задачи като независим субект. Например, да помага при купуването на продукти. Моделът изисква абонамент за ChatGPT Pro на стойност $200 на месец. AI агентите предлагат много потенциал, но все още са експериментални. Рецензент от Washington Post, например, заявява, че Operator самостоятелно е решил да поръча дузина яйца за $31, платени с кредитната му карта.
Sora е модел, който създава реалистични видеа въз основа на текст. Докато може да генерира цели сцени, а не само клипове, OpenAI признава, че често генерира „нереалистична физика“. Той е наличен само в платените версии на ChatGPT, започвайки от Plus, който струва $20 на месец.
Китайският AI модел "взриви" Силиконовата долина. DeepSeek R1 се справя добре със задачи от програмирането и математиката, а неговият отворен код означава, че всеки може да го стартира локално. Моделът е безплатен. Въпреки това, R1 интегрира китайска правителствена цензура и среща нарастващи забрани заради възможна злоупотреба с лични данни.
Моделът Gemini на Google, който беше дългоочакван, твърди, че демонстрира превъзходство при програмирането и разбирането на общите знания и култура. Освен това, има много дълъг контекстуална прозорец от 2 милиона токена, което помага на потребителите, които трябва бързо да обработват огромни обеми текст. Услугата изисква най-малко Google One AI Premium абонамент от $19.99 на месец.
Семейството модели o1 на OpenAI е предназначено да произвежда по-добри отговори чрез „размисъл“ върху отговорите чрез скрита функция за разсъждения. Моделът се отличава в програмирането, математиката и безопасността, твърди OpenAI. Понякога, обаче, може да дава подвеждащи отговори. Използването на o1 изисква абонамент за ChatGPT Plus, който е $20 на месец.
Това е най-новият модел за "разсъждения" на OpenAI, оптимизиран с цел да изпълнява успешно STEM задачи в полето на програмирането, математиката и научните изследвания. Това не е най-мощният модел на OpenAI, но тъй като е "по-малък", е и значително по-евтин. Той е безплатен, но изисква абонамент за интензивни потребители.
Този модел е един от малкото, които могат да си съперничат на o1 на OpenAI по определени индустриални бенчмаркове, като се отличава в области като математиката и програмирането. Иронично, за „модел за разсъждения“, той се "нуждае от подобрения в посока използване на здрав разум", според Alibaba. Също така включва и китайска правителствена цензура, показват тестове на TechCrunch. Той е безплатен и с отворен код.
)