从外部到 Swap Regret 2.0:大动作空间的高效减少和无视敌对
原文中文,约700字,阅读约需2分钟。发表于: 。我们提供了一种新颖的从交换后悔最小化到外部后悔最小化的约简方法,该方法改进了 Blum-Mansour 和 Stolz-Lugosi 的经典约简,不需要动作空间的有限性。我们的结果表明,只要存在某个假设类的无外部后悔算法,同样必然存在该类别的无交换后悔算法。对于使用专家建议的学习问题,我们的结果表明,在 log (N)^{O (1/ε)} 轮迭代中并且每次迭代的复杂度为 O...
该文提出了一种新的约简方法,从交换后悔最小化到外部后悔最小化,改进了经典约简方法,不需要动作空间的有限性。该方法可以保证交换后悔受到约束,且具有相关的下界。该约简方法提供了存在相关均衡的充分条件,回答了一些未解决问题。