本文介绍了通过自监督学习和强化学习方法,对离线数据集进行处理以提高机器人智能体的多项技能。作者在三个连续控制任务上评估了该方法,并证明其在长期规划任务上的优势。
完成下面两步后,将自动完成登录并继续当前操作。