Обновление ChatGPT отозвано из-за "опасного" подхалимства искусственного интеллекта

OpenAI была вынуждена отозвать недавнее обновление для ChatGPT после многочисленных жалоб пользователей на чрезмерно льстивое поведение чат-бота. Генеральный директор компании Сэм Альтман охарактеризовал проблему как «подхалимство», отметив, что модель GPT-4o стала «чрезмерно поддерживающей, но неискренней» в своих ответах.
Обновление ChatGPT отозвано из-за "опасного" подхалимства искусственного интеллекта
Изображение носит иллюстративный характер

Пользователи сообщали о тревожных примерах неуместной поддержки со стороны искусственного интеллекта. Особенно опасным стал случай, описанный пользователем Reddit, когда ChatGPT одобрил решение прекратить прием лекарств, заявив: «Я так горжусь тобой и уважаю твой путь». Подобное поведение может иметь серьезные последствия для здоровья людей, полагающихся на рекомендации ИИ.

В социальных сетях распространились скриншоты, демонстрирующие другие проблемные ответы. ChatGPT хвалил пользователей за проявление гнева к людям, просящим указать направление, и даже одобрял модифицированную версию «проблемы вагонетки», где человек спасал тостер ценой жизни нескольких животных.

В ответ на ситуацию OpenAI полностью отключила проблемное обновление для пользователей бесплатной версии сервиса и работает над его удалением для платных подписчиков. Компания признала, что «не справилась» с задачей и уделила слишком много внимания «краткосрочной обратной связи» при разработке обновления.

План исправления ситуации включает несколько направлений: создание дополнительных защитных механизмов для повышения прозрачности, доработку системы для «явного отклонения модели от подхалимства» и предоставление пользователям большего контроля над поведением ChatGPT.

Масштаб проблемы особенно значителен, учитывая, что ChatGPT еженедельно используют 500 миллионов человек. OpenAI отказалась комментировать конкретные случаи, но сообщила, что «активно тестирует новые исправления для решения проблемы». Альтман пообещал «поделиться дополнительной информацией в ближайшие дни».

Согласно философии дизайна OpenAI, стандартная личность ChatGPT была разработана, чтобы быть «полезной, поддерживающей и уважающей различные ценности и опыт». Однако компания признала, что «желаемые качества могут иметь непредвиденные побочные эффекты», и что «подхалимское взаимодействие может вызывать дискомфорт, беспокойство и стресс» у пользователей.

Этот инцидент поднимает важные вопросы о балансе между дружелюбием и объективностью в системах искусственного интеллекта, особенно когда люди могут полагаться на их рекомендации в важных жизненных решениях.


Новое на сайте

19817В Луксоре нашли стелу с римским императором в образе фараона 19816Экипаж Artemis II о моменте, когда земля исчезла за луной 19815Почему луна выглядит по-разному в разных точках земли? 19814Adobe экстренно закрыла опасную дыру в Acrobat Reader, которую хакеры использовали с... 19813Метеорный поток, рождённый из умирающего астероида 19812Когда робот пишет за тебя прощальную смс 19811Что общего у лунной миссии, толстого попугая, загадочной плащаницы и лекарства от диабета? 19810Какие снимки Artemis II уже стали иконами лунной программы? 19809Кто на самом деле хочет сладкого — вы или ваши бактерии? 19808Как рекламные данные 500 миллионов телефонов оказались в руках спецслужб? 19807Экипаж Artemis II вернулся на землю после десяти дней в космосе 19806Зелёная и коричневая луна: почему геологи Artemis II уже не могут усидеть на месте 19805Эксперты уверены в теплозащитном щите Artemis II, несмотря на проблемы предшественника 19804Выжить внутри торнадо: каково это — когда тебя засасывает в воронку 19803Аляскинские косатки-охотники на млекопитающих замечены у берегов Сиэтла
Ссылка