小红花·文摘

本文探讨了利用机器学习解决博弈均衡问题的方法，提出了一种基于有限和结构的改进算法，采用方差缩减技术以提升性能。该方法具备可验证的退出准则，提供复杂性保证，并在样本复杂度上实现显著优化，适用于多种优化问题，尤其在强化学习和随机优化领域表现突出。

在范数空间中的随机 Halpern 迭代及其在强化学习中的应用

BriefGPT - AI 论文速递 ·

该文提出了一种基于有限和结构的机器学习方法，用于解决针对敌对鲁棒性或多主体环境产生的博弈均衡问题。该方法通过引入可比较的单调性和方差缩减技术改进了经典的 Halpern 迭代，取得了性能改进。其 oracle 复杂性为 $𝜃(𝑛+√𝑛𝐿𝜖^{-1})$，相较于现有方法提升了多达√𝑛倍。该方法创造了一项新的成果，可以应用于通用有限和单调包含问题和具体问题中。进一步论证表明，在单调 Lipschitz 设置中，除去多项式对数因子，这种复杂性是无法被改进的，即提供的结果几乎是最优的。

有限和单调包含的方差减少哈尔彭迭代

BriefGPT - AI 论文速递 ·