Меню

Применение механизма внимания в задаче коммивояжера

Родолфо

Механизм внимания, изначально разработанный для улучшения seq-to-seq моделей в задачах машинного перевода, нашел применение в решении задачи коммивояжера. Заменив токены слов координатами городов, можно использовать архитектуру Pointer Networks. Этот подход, основанный на обучении с подкреплением, позволяет модели самостоятельно находить оптимальные маршруты, минимизируя общую дистанцию.
Применение механизма внимания в задаче коммивояжера

Применение механизма внимания в задаче коммивояжера

Изображение носит иллюстративный характер

Pointer Networks используют кодировщик и декодер, как в моделях перевода, но вместо целевого текста генерируют последовательность индексов городов. В модулях внимания происходит вычисление вероятностей выбора следующего города, основываясь на скрытом состоянии декодера и выходах кодировщика. Эта вероятность корректируется с учетом уже посещенных городов, гарантируя, что модель не выберет один и тот же город дважды.

Обучение модели происходит путем сравнения результатов множества проходов. Целью оптимизации является минимизация пути. Модель обучается находить кратчайший путь, опираясь на награду, основанную на сравнении длины текущего маршрута с длинами предыдущих итераций. При этом на итоговый результат влияет не только финальный результат, но и промежуточные.

Несмотря на перспективность подхода, Pointer Networks сталкиваются с ограничениями: рекуррентная природа LSTM/GRU блоков препятствует параллелизации вычислений. Также остается вопрос, насколько важна последовательность посещения городов для выбора следующего. Тем не менее, модели демонстрируют способность к обобщению, что позволяет применять их для решения задач с новыми наборами координат городов.

Источник: welcome2hype

← Предыдущее в разделе Следующее в разделе →

Вверх

Новое на сайте

Скелет великана с трепанированным черепом обнаружен в массовом захоронении эпохи викингов

Почему пустыни возникают на берегу океана?

Кто вы по хронотипу — сова или жаворонок?

Сколько миллиардов лет отведено земле и другим планетам до их неизбежного разрушения?

Как экспериментальная назальная вакцина защищает лабораторных мышей от вирусов, бактерий...

Как привычная проверка паспорта превращается в скрытый канал утечки данных внутри...

Многоступенчатая угроза VOIDGEIST: как злоумышленники скрытно внедряют трояны XWorm,...

Эпоха «вайбвейра»: ИИ и экзотический код в масштабных кибератаках группировки APT36

Почему переход на ИИ-управление рисками становится главным условием роста для современных...

Атака на телекоммуникации южной Америки: новые инструменты китайской группировки UAT-9244

Критические бреши Hikvision и Rockwell Automation спровоцировали экстренные меры...

Масштабная кампания ClickFix использует Windows Terminal для развертывания Lumma Stealer...

Критический март для Cisco: хакеры активно эксплуатируют уязвимости Catalyst SD-WAN...

Трансформация двухколесного будущего: от индустриального триумфа до постапокалиптического...

Смертельный симбиоз спама и эксплойтов: как хакеры захватывают корпоративные сети за 11...

Меню

МенюЗакрыть