本文提出了一种基于自动微分的竞争镜像下降(CMD)方法,旨在解决多智能体优化问题。通过拉格朗日乘数和Bregman势函数,研究了在零和博弈中学习ε-最优策略的收敛性,并扩展了在线镜像下降法(OMD)在均衡计算中的应用,证明其在多代理游戏中优于传统算法。
完成下面两步后,将自动完成登录并继续当前操作。