Применение механизма внимания в задаче коммивояжера

Механизм внимания, изначально разработанный для улучшения seq-to-seq моделей в задачах машинного перевода, нашел применение в решении задачи коммивояжера. Заменив токены слов координатами городов, можно использовать архитектуру Pointer Networks. Этот подход, основанный на обучении с подкреплением, позволяет модели самостоятельно находить оптимальные маршруты, минимизируя общую дистанцию.
Применение механизма внимания в задаче коммивояжера
Изображение носит иллюстративный характер

Pointer Networks используют кодировщик и декодер, как в моделях перевода, но вместо целевого текста генерируют последовательность индексов городов. В модулях внимания происходит вычисление вероятностей выбора следующего города, основываясь на скрытом состоянии декодера и выходах кодировщика. Эта вероятность корректируется с учетом уже посещенных городов, гарантируя, что модель не выберет один и тот же город дважды.

Обучение модели происходит путем сравнения результатов множества проходов. Целью оптимизации является минимизация пути. Модель обучается находить кратчайший путь, опираясь на награду, основанную на сравнении длины текущего маршрута с длинами предыдущих итераций. При этом на итоговый результат влияет не только финальный результат, но и промежуточные.

Несмотря на перспективность подхода, Pointer Networks сталкиваются с ограничениями: рекуррентная природа LSTM/GRU блоков препятствует параллелизации вычислений. Также остается вопрос, насколько важна последовательность посещения городов для выбора следующего. Тем не менее, модели демонстрируют способность к обобщению, что позволяет применять их для решения задач с новыми наборами координат городов.


Новое на сайте

19779Кератин как тормоз воспаления: неожиданная роль знакомого белка 19778Ботнет Chaos перенацелился на облака и обзавёлся SOCKS-прокси 19777Когда комета PanSTARRS станет видна невооружённым глазом? 19776Почему списки «качеств лидера» не работают и что делают настоящие руководители 19775Спичечные этикетки как летопись потерянного Малибу 19774Тёмная материя корпоративных учётных записей: почему половина цифровых идентичностей... 19773Тысячи уязвимостей нулевого дня: что нашла ИИ-модель Anthropic в крупнейших системах мира 19772Как женщина начала чихать личинками и поставила врачей в тупик? 19771Почему учёный-изгнанник из Ирана получает главную водную премию мира? 19770Вечные химикаты: как DuPont отравил планету 19769ДНК раскрыла происхождение человека из испанского мегалита, но его вера так и осталась... 19768Какапо: самый толстый попугай планеты переживает рекордный бэби-бум 19767Docker позволял взломать хост одним большим запросом — и ИИ сам до этого додумался 19766Откуда взялась республиканская партия: революция или консерватизм? 19765ИИ в медицине: когда алгоритм «видит» то, чего нет
Ссылка