Auto-Bidding with Nash Equilibrium Constraints and Bi-Level Reinforcement Learning
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了一种新的自动出价问题表述——纳什均衡约束出价(NCB),旨在最大化广告商的社会福利并满足$ ext{ε}$-纳什均衡约束。通过双层策略梯度框架,成功克服了NCB问题的复杂性,实验结果验证了其有效性。
🎯
关键要点
- 本研究提出了一种新的自动出价问题表述——纳什均衡约束出价(NCB)。
- NCB旨在最大化广告商的社会福利,同时满足ε-纳什均衡约束。
- 通过引入具有理论保证的双层策略梯度(BPG)框架,克服了NCB问题的复杂性。
- 该方法的计算复杂度与广告商数量无关。
- 实验结果验证了该方法的有效性。
➡️