Меню

Ценообразование с контекстными бандитами

Теодолиус

Контекстные многорукие бандиты (CMAB) представляют собой усовершенствованный метод обучения с подкреплением для динамического ценообразования. Они учитывают контекст, такой как характеристики магазина и сезонные факторы, что позволяет оптимизировать цены в разных условиях, в отличие от классических MAB, которые предполагают однородность условий.
Ценообразование с контекстными бандитами

Ценообразование с контекстными бандитами

Изображение носит иллюстративный характер

Ключевым моментом при использовании CMAB является моделирование связи между контекстом и спросом. В качестве моделей используются байесовская линейная регрессия и гауссовские процессы. Байесовская регрессия предполагает линейную зависимость, в то время как гауссовские процессы способны моделировать сложные нелинейные связи. Оба подхода используются в сочетании с алгоритмами выбора цен: Thompson Sampling (TS) и Upper Confidence Bound (UCB). TS основан на сэмплировании распределения наград, а UCB использует верхнюю доверительную границу оценки награды, учитывая неопределенность.

Эксперименты показали, что в задаче ценообразования UCB, как правило, обеспечивает более быстрый результат по снижению потерь (regret). При этом TS демонстрирует более стабильную сходимость к оптимальной цене, хотя может потребовать больше времени для обучения. Выбор между UCB и TS зависит от критерия оптимизации – минимизация потерь за короткое время или стабильный выбор оптимальной цены в долгосрочной перспективе. Важно отметить, что гауссовские процессы, несмотря на свою гибкость, могут потребовать более тщательной настройки для достижения лучших результатов, чем байесовская линейная регрессия.

Источник: muxeu

← Предыдущее в разделе Следующее в разделе →

Вверх

Новое на сайте

Кости прерий: как истребление бизонов породило целую индустрию — и сама себя же уничтожила

Кто и зачем взламывает серверы Ollama и ComfyUI ради ключей от AWS?

Как злоумышленники спрятали командный сервер внутри блокчейна и почему его невозможно...

Брюссель заставляет Android делиться секретами с чужими ИИ-помощниками

WordPress: как два бага слились в одну критическую дыру, которую назвали wp2shell

Как китайские хакеры обманули DigiCert и украли сертификаты для подписи кода?

Что скрывается за уязвимостью, которую агентство США внесло в список активно используемых...

Автономные системы наступают быстрее, чем инфраструктура для управления ими: кто выиграет...

Почему в OpenSSL нашли дыру, съедающую память серверов, но не дали ей даже номер CVE?

SonicWall SMA 1000: как два бага превратили VPN-шлюз в бэкдор для атакующих

Может ли уязвимость в клиенте Zoom для Windows открыть доступ к чужому аккаунту без...

TELEPUZ: новый вредонос на C, который научился прятаться в Telegram, Steam и блокчейне...

Дома из дёрна: как исландцы триста лет прятались от холода под слоем земли и травы

Как один токен от чужого сервиса мог впустить злоумышленника в чужой аккаунт n8n?

Меню

МенюЗакрыть