小红花·文摘

本文介绍了通过自监督学习和强化学习方法，对离线数据集进行处理以提高机器人智能体的多项技能。作者在三个连续控制任务上评估了该方法，并证明其在长期规划任务上的优势。