小红花·文摘

研究提出了一种新的近端点算法，解决均场博弈中均衡计算的收敛问题。在拉斯里-里昂斯单调条件下，该算法首次保证最后迭代收敛，并在$ ext{O}( ext{log}(1/ ext{ε}))$次迭代后达到$ ext{ε}$精度。这为大规模博弈提供了有效方法。文章还综述了多种均场博弈学习方法，如深度强化学习和在线镜像下降法，展示了其应用和优势。

单调均场博弈中的最终迭代收敛

BriefGPT - AI 论文速递 ·

本文提出了一种基于自动微分的竞争镜像下降（CMD）方法，旨在解决多智能体优化问题。通过拉格朗日乘数和Bregman势函数，研究了在零和博弈中学习ε-最优策略的收敛性，并扩展了在线镜像下降法（OMD）在均衡计算中的应用，证明其在多代理游戏中优于传统算法。

可配置镜像下降：决策制定的统一化

BriefGPT - AI 论文速递 ·