不完全信息博弈中近似(粗糙)相关均衡的复杂性
原文中文,约300字,阅读约需1分钟。发表于: 。我们研究了不完全信息博弈中分布式学习近似相关均衡的迭代复杂度,我们证明了在广义形式博弈中,假设 PPAD 不属于 TIME (n^polylog (n)),任何多项式时间学习算法至少需要 2^log_2^{1-o (1)}(|I|) 次迭代才能收敛于 ε- 近似相关均衡集合,同时我们给出了无耦合动态的方法,在对数次迭代中达到 ε- 近似相关均衡的贝叶斯博弈,无需考虑类型的数量。
本文研究了去中心化多智能体强化学习问题中的不后悔算法,发现无法以多项式时间实现无后悔学习。该文提出了基于集聚方法的创新性应用,并对博弈理论和强化学习算法研究方向提出了新的思考。