Ssylka

Применение механизма внимания в задаче коммивояжера

Механизм внимания, изначально разработанный для улучшения seq-to-seq моделей в задачах машинного перевода, нашел применение в решении задачи коммивояжера. Заменив токены слов координатами городов, можно использовать архитектуру Pointer Networks. Этот подход, основанный на обучении с подкреплением, позволяет модели самостоятельно находить оптимальные маршруты, минимизируя общую дистанцию.
Применение механизма внимания в задаче коммивояжера
Изображение носит иллюстративный характер

Pointer Networks используют кодировщик и декодер, как в моделях перевода, но вместо целевого текста генерируют последовательность индексов городов. В модулях внимания происходит вычисление вероятностей выбора следующего города, основываясь на скрытом состоянии декодера и выходах кодировщика. Эта вероятность корректируется с учетом уже посещенных городов, гарантируя, что модель не выберет один и тот же город дважды.

Обучение модели происходит путем сравнения результатов множества проходов. Целью оптимизации является минимизация пути. Модель обучается находить кратчайший путь, опираясь на награду, основанную на сравнении длины текущего маршрута с длинами предыдущих итераций. При этом на итоговый результат влияет не только финальный результат, но и промежуточные.

Несмотря на перспективность подхода, Pointer Networks сталкиваются с ограничениями: рекуррентная природа LSTM/GRU блоков препятствует параллелизации вычислений. Также остается вопрос, насколько важна последовательность посещения городов для выбора следующего. Тем не менее, модели демонстрируют способность к обобщению, что позволяет применять их для решения задач с новыми наборами координат городов.


Новое на сайте

19032Микрогравитация на мкс превратила вирусы в эффективных убийц устойчивых бактерий 19031Как древние римляне управляли капиталом, чтобы обеспечить себе пассивный доход и защитить... 19030Миссия Pandora: новый инструмент NASA для калибровки данных телескопа «Джеймс Уэбб» 19029Телескоп Джеймс Уэбб запечатлел «неудавшиеся звезды» в звездном скоплении вестерлунд 2 19028Как «пенопластовые» планеты в системе V1298 Tau стали недостающим звеном в понимании... 19027Возможно ли одновременное глобальное отключение всего мирового интернета? 19026Станет ли бактериальная система самоуничтожения SPARDA более гибким инструментом... 19025Насколько опасной и грязной была вода в древнейших банях Помпей? 19024Гравитационная ориентация и структура космических плоскостей от земли до сверхскоплений 19023Сколько частей тела и органов можно потерять, чтобы остаться в живых? 19022Зачем Сэм Альтман решил внедрить рекламу в бесплатные версии ChatGPT? 19021Хитроумная маскировка вредоноса GootLoader через тысячи склеенных архивов 19020Удастся ли знаменитому археологу Захи Хавассу найти гробницу Нефертити до ухода на покой? 19019Действительно ли «зомби-клетки» провоцируют самую распространенную форму эпилепсии и... 19018Генетический анализ мумий гепардов из саудовской Аравии открыл путь к возрождению...