GO-DICE是一种离线模仿学习技术,用于处理长期目标驱动的顺序任务。实验结果表明GO-DICE在Mujoco机器人任务的完成率方面有明显改善。GO-DICE还能够利用不完美的示例和部分任务分割来提高任务的性能。
完成下面两步后,将自动完成登录并继续当前操作。