Готовы ли мы к эре гедонистических машин?

Пионеры обучения с подкреплением, удостоенные престижной премии A.M. Turing Award – эквивалента Нобелевской премии в компьютерных науках – перевернули представление о возможностях искусственного интеллекта. Награду ежегодно спонсирует Google с призовым фондом в US $1 миллион, а ее вручили на общем собрании ACM в среду.
Готовы ли мы к эре гедонистических машин?
Изображение носит иллюстративный характер

76-летний Эндрю Барто, ранее работавший в Университете Массачусетса в Эмерсте, зарекомендовал себя своими первыми исследованиями в условиях, когда обучение с подкреплением было мало популярно. Его слова – «Мы были своего рода в пустыне. Вот почему так приятно получать эту награду...» – отражают путь от экспериментальных достижений к признанию значимости их работы.

67-летний Ричард Саттон, профессор Университета Альберты, внес неоценимый вклад в разработку теорий и алгоритмов, легших в основу дисциплины. Он подчеркнул, что идея, изложенная Аланом Тьюрингом в 1947 году о машине, которая «может учиться на опыте», стала краеугольным камнем развития обучения с подкреплением.

Методология, разработанная Барто и Саттоном, основывается на принципах, аналогичных дрессировке животных посредством позитивного подкрепления. Их подход, называемый «гедонистическим», использует концепции психологии и нейронаук, связанные с реакцией нейронов на вознаграждения и наказания.

Исследовательская работа началась в конце 1970-х годов в Университете Массачусетса, а в начале 1980-х был опубликован знаковый документ, демонстрирующий успешное решение задачи балансировки шеста на движущейся тележке в смоделированном окружении. Этот эксперимент стал отправной точкой для последующих прорывов в сфере искусственного интеллекта.

Разработанные методы сыграли ключевую роль в ряде современных достижений: от победы компьютерной программы Google над чемпионами древней игры го в 2016 и 2017 годах до оптимизации финансовых торговых стратегий и программ, обеспечивающих работу ChatGPT. Джефф Дин, главный ученый Google, отмечает: «Инструменты, которые они разработали, по-прежнему остаются центральной опорой взрыва AI-революции, способствовав значительным прорывам, привлечению легионов молодых исследователей и инвестициям на миллиарды долларов».

Фундаментальное отличие подхода Барто и Саттона состоит в выборе между обучением на основе данных, предоставленных людьми, и самостоятельным опытом ИИ-агентов. Так, Барто, называющий себя луддитом, предостерегает о возможных неожиданных последствиях быстрого технологического прогресса, тогда как Саттон оптимистично заявляет: «Люди — машины. Они удивительные, замечательные машины... [они] не являются 'конечным продуктом' и могут работать лучше».

Награждение премией, названной в честь Алана Тьюринга – британского математика, криптоаналитика и одного из первых мыслителей в области искусственного интеллекта, – символизирует продолжение идеи создания машин, способных учиться на опыте. Исследования Барто и Саттона проложили путь к современным прорывам и определяют развитие ИИ в ближайшие десятилетия.


Новое на сайте

19521Банковский троян VENON на Rust атакует Бразилию с помощью девяти техник обхода защиты 19520Бонобо агрессивны не меньше шимпанзе, но всё решают самки 19519Почему 600-килограммовый зонд NASA падает на Землю из-за солнечной активности? 19518«Липовый календарь»: как расписание превращает работников в расходный материал 19517Вредоносные Rust-пакеты и ИИ-бот крадут секреты разработчиков через CI/CD-пайплайны 19516Как хакеры за 72 часа превратили npm-пакет в ключ от целого облака AWS 19515Как WebDAV-диск и поддельная капча помогают обойти антивирус? 19514Могут ли простые числа скрываться внутри чёрных дыр? 19513Метеорит пробил крышу дома в Германии — откуда взялся огненный шар над Европой? 19512Уязвимости LeakyLooker в Google Looker Studio открывали доступ к чужим базам данных 19511Почему тысячи серверов оказываются открытой дверью для хакеров, хотя могли бы ею не быть? 19510Как исследователи за четыре минуты заставили ИИ-браузер Perplexity Comet попасться на... 19509Может ли женщина без влагалища и шейки матки зачать ребёнка естественным путём? 19508Зачем учёные из Вены создали QR-код, который невозможно увидеть без электронного... 19507Девять уязвимостей CrackArmor позволяют получить root-доступ через модуль безопасности...
Ссылка