最新研究发现,使用解耦的物体表示可以提高基于图像的物体中心强化学习任务的策略学习效果。一种新颖的物体中心强化学习算法结合了演员-评论家和基于模型的方法,有效地利用这些表示。该算法在视觉复杂的三维机器人环境和具有组合结构的二维环境中表现出色。
完成下面两步后,将自动完成登录并继续当前操作。