Способны ли новые модели OpenAI превзойти предыдущие?

OpenAI представила новую «рассуждающую» модель o3-mini, доступную в ChatGPT и через API. Пользователи ChatGPT Plus и Team получают 150 сообщений в день, Pro – неограниченный доступ. Бесплатные пользователи смогут получить доступ к модели через функцию "Reason". Модель o3-mini позиционируется как компромисс между скоростью и точностью, а версия o3-mini-high предлагает более высокий интеллект с увеличенной задержкой.
Способны ли новые модели OpenAI превзойти предыдущие?
Изображение носит иллюстративный характер

o3-mini также обладает функцией поиска для актуальной информации со ссылками на источники, хотя и в статусе «раннего прототипа». Различия в производительности между различными моделями, включая o1, o1-mini и варианты o3-mini (low, medium, high), были представлены в виде графиков для математических задач и научных вопросов.

Однако в комментариях к анонсу o3-mini были высказаны сомнения в том, что новая модель превосходит предыдущие. Также были замечания о том, что другие компании, такие как ДикПик R1, Qwen, Ллама 4, Мистраль, выпускают модели быстрее и возможно более продвинутые.

Необходимо дополнительное тестирование, чтобы окончательно оценить производительность и точность модели o3-mini в сравнении с ее предшественниками. Поисковые возможности модели также требуют дальнейшего развития, чтобы обеспечить точность и достоверность предоставляемой информации.


Новое на сайте

19171Вредоносное по VoidLink: созданная с помощью ИИ угроза для облачных систем и финансового... 19170Палеонтологические поиски и научные убеждения Томаса Джефферсона 19168Почему критическая уязвимость BeyondTrust и новые записи в каталоге CISA требуют... 19167Севернокорейская хакерская группировка Lazarus маскирует вредоносный код под тестовые... 19166Государственные хакеры используют Google Gemini для кибершпионажа и клонирования моделей... 19165Можно ли построить мировую сверхдержаву на чашках чая и фунтах сахара? 19164Уязвимые обучающие приложения открывают доступ к облакам Fortune 500 для криптомайнинга 19163Почему ботнет SSHStalker успешно атакует Linux уязвимостями десятилетней давности? 19162Microsoft устранила шесть уязвимостей нулевого дня и анонсировала радикальные изменения в... 19161Эскалация цифровой угрозы: как IT-специалисты КНДР используют реальные личности для... 19160Скрытые потребности клиентов и преимущество наблюдения над опросами 19159Академическое фиаско Дороти Паркер в Лос-Анджелесе 19158Китайский шпионский фреймворк DKnife захватывает роутеры с 2019 года 19157Каким образом корейские детские хоры 1950-х годов превратили геополитику в музыку и...
Ссылка