研究提出了一种新的近端点算法,解决均场博弈中均衡计算的收敛问题。在拉斯里-里昂斯单调条件下,该算法首次保证最后迭代收敛,并在$ ext{O}( ext{log}(1/ ext{ε}))$次迭代后达到$ ext{ε}$精度。这为大规模博弈提供了有效方法。文章还综述了多种均场博弈学习方法,如深度强化学习和在线镜像下降法,展示了其应用和优势。
本文提出了一种基于自动微分的竞争镜像下降(CMD)方法,旨在解决多智能体优化问题。通过拉格朗日乘数和Bregman势函数,研究了在零和博弈中学习ε-最优策略的收敛性,并扩展了在线镜像下降法(OMD)在均衡计算中的应用,证明其在多代理游戏中优于传统算法。
完成下面两步后,将自动完成登录并继续当前操作。