我们提出了一种新的算法,用于基于模型的分销式强化学习,解决了一个悬而未决的问题。我们的分析为分销式强化学习的类别方法提供了新的理论结果,并引入了一种新的分销式贝尔曼方程。我们还进行了实验研究,比较了几种基于模型的分销式强化学习算法。
完成下面两步后,将自动完成登录并继续当前操作。