Оптимизация железнодорожного трафика с помощью машинного обучения

Управление железнодорожным движением в реальном времени – сложная логистическая задача, требующая оперативного перепланирования расписания при возникновении задержек и сбоев. Классические методы комбинаторной оптимизации могут быть заменены современными подходами машинного обучения, в частности, обучением с подкреплением (RL).
Оптимизация железнодорожного трафика с помощью машинного обучения
Изображение носит иллюстративный характер

Метод Q-learning позволяет агенту (системе управления) обучаться взаимодействию с железнодорожной средой без необходимости построения сложной математической модели. Агент принимает решения на основе анализа текущей ситуации (состояния среды) и выбирает оптимальные действия, минимизирующие общие задержки.

Моделирование железнодорожной среды включает в себя представление станций и путей как ресурсов с атрибутами доступности. События (прибытие/отправление поездов) откладываются или реализуются немедленно, при этом система оценивает последствия каждого действия и корректирует свою стратегию. Функция вознаграждения стимулирует своевременное выполнение событий и наказывает за задержки, способствуя тем самым оптимизации расписания.

Состояние среды определяется текущим событием, задержками, уровнем загруженности ресурсов и информацией о следующих ресурсах по маршруту поезда. Эксперименты показали, что применение RL позволяет находить эффективные решения по перепланированию в рамках ограниченного времени обучения.


Новое на сайте

19989Шесть историй, которые умещаются на ладони 19986Как 30 000 аккаунтов Facebook оказались в руках вьетнамских хакеров? 19985LofyGang вернулась: как бразильские хакеры охотятся на геймеров через поддельные читы 19984Автономная проверка защиты: как не отстать от ИИ-атак 19983Взлом Trellix: хакеры добрались до исходного кода одной из ведущих компаний по... 19982Почему почти 3000 монет в норвежском поле перевернули представление о викингах? 19981Как поддельная CAPTCHA опустошает ваш счёт и крадёт криптовалюту? 19980Слежка за каждым шагом: как ИИ превращает государство в машину тотального контроля 19979Как хакеры грабят компании через звонок в «техподдержку» 19978Почему именно Нью-Йорк стал самым уязвимым городом восточного побережья перед... 19977Как одна команда git push открывала доступ к миллионам репозиториев 19976Зачем древние народы убивали ножами и мечами: оружие как основа власти 19975Как Python-бэкдор DEEPDOOR крадёт ваши облачные пароли незаметно? 19974Послание в бутылке: математика невозможного 19973Почему ИИ-инфраструктура стала новой целью хакеров быстрее, чем ждали все?
Ссылка