该文提出了一种新的约简方法,从交换后悔最小化到外部后悔最小化,改进了经典约简方法,不需要动作空间的有限性。该方法可以保证交换后悔受到约束,且具有相关的下界。该约简方法提供了存在相关均衡的充分条件,回答了一些未解决问题。
完成下面两步后,将自动完成登录并继续当前操作。