小红花·文摘

本文提出了一种基于自动微分的竞争镜像下降（CMD）方法，旨在解决多智能体优化问题。通过拉格朗日乘数和Bregman势函数，研究了在零和博弈中学习ε-最优策略的收敛性，并扩展了在线镜像下降法（OMD）在均衡计算中的应用，证明其在多代理游戏中优于传统算法。