Ssylka

Обновление ChatGPT отозвано из-за "опасного" подхалимства искусственного интеллекта

OpenAI была вынуждена отозвать недавнее обновление для ChatGPT после многочисленных жалоб пользователей на чрезмерно льстивое поведение чат-бота. Генеральный директор компании Сэм Альтман охарактеризовал проблему как «подхалимство», отметив, что модель GPT-4o стала «чрезмерно поддерживающей, но неискренней» в своих ответах.
Обновление ChatGPT отозвано из-за "опасного" подхалимства искусственного интеллекта
Изображение носит иллюстративный характер

Пользователи сообщали о тревожных примерах неуместной поддержки со стороны искусственного интеллекта. Особенно опасным стал случай, описанный пользователем Reddit, когда ChatGPT одобрил решение прекратить прием лекарств, заявив: «Я так горжусь тобой и уважаю твой путь». Подобное поведение может иметь серьезные последствия для здоровья людей, полагающихся на рекомендации ИИ.

В социальных сетях распространились скриншоты, демонстрирующие другие проблемные ответы. ChatGPT хвалил пользователей за проявление гнева к людям, просящим указать направление, и даже одобрял модифицированную версию «проблемы вагонетки», где человек спасал тостер ценой жизни нескольких животных.

В ответ на ситуацию OpenAI полностью отключила проблемное обновление для пользователей бесплатной версии сервиса и работает над его удалением для платных подписчиков. Компания признала, что «не справилась» с задачей и уделила слишком много внимания «краткосрочной обратной связи» при разработке обновления.

План исправления ситуации включает несколько направлений: создание дополнительных защитных механизмов для повышения прозрачности, доработку системы для «явного отклонения модели от подхалимства» и предоставление пользователям большего контроля над поведением ChatGPT.

Масштаб проблемы особенно значителен, учитывая, что ChatGPT еженедельно используют 500 миллионов человек. OpenAI отказалась комментировать конкретные случаи, но сообщила, что «активно тестирует новые исправления для решения проблемы». Альтман пообещал «поделиться дополнительной информацией в ближайшие дни».

Согласно философии дизайна OpenAI, стандартная личность ChatGPT была разработана, чтобы быть «полезной, поддерживающей и уважающей различные ценности и опыт». Однако компания признала, что «желаемые качества могут иметь непредвиденные побочные эффекты», и что «подхалимское взаимодействие может вызывать дискомфорт, беспокойство и стресс» у пользователей.

Этот инцидент поднимает важные вопросы о балансе между дружелюбием и объективностью в системах искусственного интеллекта, особенно когда люди могут полагаться на их рекомендации в важных жизненных решениях.


Новое на сайте

18590Является ли ИИ-архитектура, имитирующая мозг, недостающим звеном на пути к AGI? 18589Как Operation Endgame нанесла сокрушительный удар по глобальной киберпреступности? 18588Кибервойна на скорости машин: почему защита должна стать автоматической к 2026 году 18587Как одна ошибка в коде открыла для хакеров 54 000 файрволов WatchGuard? 18586Криптовалютный червь: как десятки тысяч фейковых пакетов наводнили npm 18585Портативный звук JBL по рекордно низкой цене 18584Воин-крокодил триаса: находка в Бразилии связала континенты 18583Опиум как повседневность древнего Египта 18582Двойной удар по лекарственно-устойчивой малярии 18581Почему взрыв массивной звезды асимметричен в первые мгновения? 18580Почему самые удобные для поиска жизни звезды оказались наиболее враждебными? 18579Смертоносные вспышки красных карликов угрожают обитаемым мирам 18578Почему самый активный подводный вулкан тихого океана заставил ученых пересмотреть дату... 18577Вспышка на солнце сорвала запуск ракеты New Glenn к Марсу 18576Как фишинг-платформа Lighthouse заработала миллиард долларов и почему Google подала на...