该论文提出了一种用于强化学习中学习动态全局模型的方法,通过学习本地动态的上下文潜向量和条件预测下一个状态来实现此目的。该方法在各种模拟机器人控制任务中实现了优异的泛化能力,超过了现有的强化学习方案。
该论文提出了一种用于强化学习中学习动态全局模型的方法,通过学习本地动态的上下文潜向量和条件预测下一个状态来实现学习全局动态模型的任务。该方法在各种模拟机器人控制任务中表现出优异的泛化能力,超过了现有的强化学习方案。
完成下面两步后,将自动完成登录并继续当前操作。