Ssylka

Способны ли новые модели OpenAI превзойти предыдущие?

OpenAI представила новую «рассуждающую» модель o3-mini, доступную в ChatGPT и через API. Пользователи ChatGPT Plus и Team получают 150 сообщений в день, Pro – неограниченный доступ. Бесплатные пользователи смогут получить доступ к модели через функцию "Reason". Модель o3-mini позиционируется как компромисс между скоростью и точностью, а версия o3-mini-high предлагает более высокий интеллект с увеличенной задержкой.
Способны ли новые модели OpenAI превзойти предыдущие?
Изображение носит иллюстративный характер

o3-mini также обладает функцией поиска для актуальной информации со ссылками на источники, хотя и в статусе «раннего прототипа». Различия в производительности между различными моделями, включая o1, o1-mini и варианты o3-mini (low, medium, high), были представлены в виде графиков для математических задач и научных вопросов.

Однако в комментариях к анонсу o3-mini были высказаны сомнения в том, что новая модель превосходит предыдущие. Также были замечания о том, что другие компании, такие как ДикПик R1, Qwen, Ллама 4, Мистраль, выпускают модели быстрее и возможно более продвинутые.

Необходимо дополнительное тестирование, чтобы окончательно оценить производительность и точность модели o3-mini в сравнении с ее предшественниками. Поисковые возможности модели также требуют дальнейшего развития, чтобы обеспечить точность и достоверность предоставляемой информации.


Новое на сайте

7824Как превратить простейшую механику в захватывающую настольную игру? 7823Как создать гармонию между работой и жизнью? 7822Имеет ли место кража технологий в области нейросетей? 7821Почему наши уши все еще 'напрягаются', когда мы слушаем? 7820Могут ли нейросети заменить современную эстраду? 7819Как устроены советские резисторы МЛТ-2 и почему их цвет меняется от температуры? 7818Кто же создал самого опасного монстра во вселенной? 7817Как многопоточность и синхронизация влияют на производительность приложений? 7816Как сохранить электрогриль в идеальном состоянии долгие годы? 7815Как оценить эффективность нагрузочного тестирования? 7814Огнедышащий смог Вавельский: дракон Кракова уходит на передышку из-за расточительности 7813Насколько точны прогнозы погоды и почему даже они ограничены? 7812Триумф звука: лучшие напольные акустические системы 2025 года 7811Как эффективно управлять переполненным браузером? 7810Как модульная квантовая архитектура открывает путь к эре сверхвычислений?