一种基于原对偶在线学习方法的顺序展示互补商品动态定价问题
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
本研究提出了一种参考价格机制,证明了降价政策是近乎最优的。同时,还解决了需求模型参数未知的学习问题,并提供了高效的学习算法。
🎯
关键要点
- 研究动态定价问题,客户对价格的反应受参考价格影响。
- 提出了一种新颖的参考价格机制,参考价格为卖方过去价格的平均值。
- 证明降价政策在该机制下是近乎最优的,无论模型参数如何。
- 提供线性需求模型下近乎最优降价政策的详细特征描述和高效计算方法。
- 考虑需求模型参数未知的动态定价和学习问题,卖方需在线学习参数并优化收入。
- 目标是最小化与卓越最优政策相比的收入损失,称为遗憾。
- 为线性需求模型提供高效学习算法,得出最优的遗憾上界为Ο(√T)。
➡️