Способны ли новые модели OpenAI превзойти предыдущие?

OpenAI представила новую «рассуждающую» модель o3-mini, доступную в ChatGPT и через API. Пользователи ChatGPT Plus и Team получают 150 сообщений в день, Pro – неограниченный доступ. Бесплатные пользователи смогут получить доступ к модели через функцию "Reason". Модель o3-mini позиционируется как компромисс между скоростью и точностью, а версия o3-mini-high предлагает более высокий интеллект с увеличенной задержкой.
Способны ли новые модели OpenAI превзойти предыдущие?
Изображение носит иллюстративный характер

o3-mini также обладает функцией поиска для актуальной информации со ссылками на источники, хотя и в статусе «раннего прототипа». Различия в производительности между различными моделями, включая o1, o1-mini и варианты o3-mini (low, medium, high), были представлены в виде графиков для математических задач и научных вопросов.

Однако в комментариях к анонсу o3-mini были высказаны сомнения в том, что новая модель превосходит предыдущие. Также были замечания о том, что другие компании, такие как ДикПик R1, Qwen, Ллама 4, Мистраль, выпускают модели быстрее и возможно более продвинутые.

Необходимо дополнительное тестирование, чтобы окончательно оценить производительность и точность модели o3-mini в сравнении с ее предшественниками. Поисковые возможности модели также требуют дальнейшего развития, чтобы обеспечить точность и достоверность предоставляемой информации.


Новое на сайте

19723Что если вселенная никогда не начиналась с точки бесконечной плотности? 19722Доживёт ли комета MAPS до субботы? 19721Квантовый процессор IBM побил сразу два рекорда — что это меняет? 19720Как северная Корея похитила $285 миллионов у Drift через предподписанные транзакции? 19719Как хакеры через одну дыру в Next.js украли ключи от 766 серверов? 19718Artemis II покинул земную орбиту и летит к луне 19717NASA показало невиданные снимки кометы 3I/ATLAS и запечатлело старт лунной миссии Artemis... 19716Сифилис появился 4000 лет назад — или его находили не там, где искали? 19715Энергетический дисбаланс земли зашкаливает, и учёные не могут это объяснить 19714Cisco закрыла две критические уязвимости с рейтингом 9.8 из 10 в системах IMC и SSM 19713Водород из хлебных крошек: реакция, которая может потеснить ископаемое топливо 19712Китайский спутник с «рукой осьминога» прошёл орбитальный тест дозаправки 19711Кто такие поэты и почему поэзия важна сегодня? 19710Фальшивые установщики и ISO-файлы: как киберпреступники зарабатывают на майнинге и троянах 19709Почему большие языковые модели так и не научились думать
Ссылка