Искусственный интеллект обретает внутренний голос

Новый метод обучения искусственного интеллекта (ИИ), названный Quiet-STaR, позволяет ему генерировать внутренние размышления перед тем, как отвечать на запросы, аналогично тому, как человек обдумывает свои слова перед тем, как их произнести. Это кардинально отличается от подхода, используемого в популярных чат-ботах, таких как ChatGPT, которые не «думают» о том, что пишут.
Искусственный интеллект обретает внутренний голос
Изображение носит иллюстративный характер

Quiet-STaR обучает ИИ параллельно генерировать множество внутренних рассуждений, из которых затем выбирается наилучший ответ, который может быть верифицирован человеком. Такой подход позволяет ИИ предвосхищать будущие диалоги и учиться на текущих, отбрасывая ошибочные варианты рассуждений.

Применив Quiet-STaR к открытой модели Mistral 7B, исследователи добились значительного улучшения показателей. В частности, модель показала 47.2% в тестах на рассуждение, в отличие от 36.3% до обучения, и хотя она по-прежнему проваливает тесты по математике, ее результаты выросли с 5.9% до 10.9%.

Этот подход отличается от предыдущих попыток улучшить рассуждающие способности ИИ, которые были узкоспециализированными и не могли применяться к разным типам моделей. Quiet-STaR, основанный на алгоритме STaR, может быть применен к различным языковым моделям, приближая ИИ к человеческому мышлению.


Новое на сайте

19215Как новые SaaS-платформы вроде Starkiller и 1Phish позволяют киберпреступникам незаметно... 19214Инженерия ужаса: как паровые машины и математика создали гений Эдгара Аллана по 19213Трансформация первой линии SOC: три шага к предиктивной безопасности 19212Архитектура смыслов в профессиональной редактуре 19209Как беспрецедентный бунт чернокожих женщин в суде Бостона разрушил планы рабовладельцев? 19208Как новые поколения троянов удаленного доступа захватывают системы ради кибершпионажа и... 19207Почему мировые киберпреступники захватили рекламные сети, и как Meta вместе с властями... 19206Как фальшивый пакет StripeApi.Net в NuGet Gallery незаметно похищал финансовые API-токены... 19205Зачем неизвестная группировка UAT-10027 внедряет бэкдор Dohdoor в системы образования и... 19204Ритуальный предсвадебный плач как форма протеста в традиционном Китае 19203Невидимая угроза в оперативной памяти: масштабная атака северокорейских хакеров на... 19202Как уязвимость нулевого дня в Cisco SD-WAN позволяет хакерам незаметно захватывать... 19201Как Google разрушил глобальную шпионскую сеть UNC2814, охватившую правительства 70 стран...
Ссылка