Auto-Bidding with Nash Equilibrium Constraints and Bi-Level Reinforcement Learning

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出了一种新的自动出价问题表述——纳什均衡约束出价(NCB),旨在最大化广告商的社会福利并满足$ ext{ε}$-纳什均衡约束。通过双层策略梯度框架,成功克服了NCB问题的复杂性,实验结果验证了其有效性。

🎯

关键要点

  • 本研究提出了一种新的自动出价问题表述——纳什均衡约束出价(NCB)。
  • NCB旨在最大化广告商的社会福利,同时满足ε-纳什均衡约束。
  • 通过引入具有理论保证的双层策略梯度(BPG)框架,克服了NCB问题的复杂性。
  • 该方法的计算复杂度与广告商数量无关。
  • 实验结果验证了该方法的有效性。
➡️

继续阅读