OpenAI представляет новое семейство "рассуждающих" моделей o3

OpenAI анонсировала модели o3 и o3-mini, которые отличаются от предыдущей модели o1 способностью «думать» перед ответом. Это означает, что модели предоставляют цепочку своих рассуждений, прежде чем выдать окончательный ответ. Время, которое модель тратит на рассуждение, можно будет настраивать, что теоретически позволит достигать более точных ответов.
OpenAI представляет новое семейство "рассуждающих" моделей o3
Изображение носит иллюстративный характер

В тестах ARC-AGI модель o3 продемонстрировала результат 87,5%, что выше «человеческого уровня» в 85%, но стоит учитывать, что эти данные нуждаются во внешней проверке. Модели пока не доступны для широкого пользования и сначала будут протестированы исследователями в области безопасности. Выпуск o3-mini ожидается к концу января 2025 года, а затем и полной версии o3.
Ранняя версия модели o1 была представлена в сентябре 2024, а полная версия o1 была выпущена в декабре 2024 с подпиской ChatGPT Pro. Модель o1, как было заявлено, должна превосходить GPT-4o в задачах рисования, работы с текстом и программирования, что было показано на примерах в статье про o1. Также стоит отметить, что существует платная версия o1 доступная в телеграм боте.


Новое на сайте

19770Вечные химикаты: как DuPont отравил планету 19769ДНК раскрыла происхождение человека из испанского мегалита, но его вера так и осталась... 19768Какапо: самый толстый попугай планеты переживает рекордный бэби-бум 19767Docker позволял взломать хост одним большим запросом — и ИИ сам до этого додумался 19766Откуда взялась республиканская партия: революция или консерватизм? 19765ИИ в медицине: когда алгоритм «видит» то, чего нет 19764Почему зрелые системы управления доступом в 2026 году стали опаснее, чем незрелые? 19763Почему пароли до сих пор обходятся бизнесу дороже, чем кажется? 19762Как больше тысячи незащищённых серверов ComfyUI стали фермой для майнинга криптовалют? 19761Почему война Калифорнии со смогом в 1970-х изменила весь автопром? 19760Почему фальшивый «слив» Claude Code оказался ловушкой для сотен разработчиков? 19759Как физики умудрились перевезти антиматерию в обычном грузовике? 19758Атака GPUBreach: как через видеопамять можно получить полный контроль над компьютером 19757Что за ядовито-зелёное пятно на водохранилище в ЮАР видно даже из космоса? 19756Как Storm-1175 из Китая ломает корпоративные сети за сутки и что делает Medusa настолько...
Ссылка