小红花·文摘

该论文提出了一种用于强化学习中学习动态全局模型的方法，通过学习本地动态的上下文潜向量和条件预测下一个状态来实现此目的。该方法在各种模拟机器人控制任务中实现了优异的泛化能力，超过了现有的强化学习方案。