Ценообразование с контекстными бандитами

Контекстные многорукие бандиты (CMAB) представляют собой усовершенствованный метод обучения с подкреплением для динамического ценообразования. Они учитывают контекст, такой как характеристики магазина и сезонные факторы, что позволяет оптимизировать цены в разных условиях, в отличие от классических MAB, которые предполагают однородность условий.
Ценообразование с контекстными бандитами
Изображение носит иллюстративный характер

Ключевым моментом при использовании CMAB является моделирование связи между контекстом и спросом. В качестве моделей используются байесовская линейная регрессия и гауссовские процессы. Байесовская регрессия предполагает линейную зависимость, в то время как гауссовские процессы способны моделировать сложные нелинейные связи. Оба подхода используются в сочетании с алгоритмами выбора цен: Thompson Sampling (TS) и Upper Confidence Bound (UCB). TS основан на сэмплировании распределения наград, а UCB использует верхнюю доверительную границу оценки награды, учитывая неопределенность.

Эксперименты показали, что в задаче ценообразования UCB, как правило, обеспечивает более быстрый результат по снижению потерь (regret). При этом TS демонстрирует более стабильную сходимость к оптимальной цене, хотя может потребовать больше времени для обучения. Выбор между UCB и TS зависит от критерия оптимизации – минимизация потерь за короткое время или стабильный выбор оптимальной цены в долгосрочной перспективе. Важно отметить, что гауссовские процессы, несмотря на свою гибкость, могут потребовать более тщательной настройки для достижения лучших результатов, чем байесовская линейная регрессия.


Новое на сайте

19857Острова как политический побег: от Атлантиды до плавучих государств Питера Тиля 19856Яйца, которые спасли предков млекопитающих от худшего апокалипсиса на Земле? 19855Могут ли омары чувствовать боль, и почему учёные требуют запретить варить их живыми? 19854Премия в $3 млн за первое CRISPR-лечение серповидноклеточной анемии 19853Почему сотрудники игнорируют корпоративное обучение и как это исправить 19852Тинтагель: место силы Артура или красивая легенда? 19851Голоса в голове сказали правду: что происходит, когда галлюцинации ставят диагноз точнее... 19850Куда исчезает информация из чёрных дыр, если они вообще исчезают? 19849Чёрная дыра лебедь Х-1 бросает джеты со скоростью света — но кто ими управляет? 19848Что увидели фотографы над замком Линдисфарн — и почему они закричали? 19847Почему антисептики в больницах могут создавать устойчивых к ним микробов? 19846Правда ли, что курица может жить без головы? 19845Как Оскар Уайльд использовал причёску как оружие против викторианской морали? 19844Назальный спрей против всех вирусов: как далеко зашла наука 19843«Я ещё не осознал, что мы только что сделали»: первая пресс-конференция экипажа Artemis II
Ссылка