本文介绍了一种全学习的层次化框架,可以同时学习低层控制器和高层潜在动作空间,并对多个机器人的运动进行泛化。通过模型预测控制方法计划连续潜在动作,成功实现了多个任务和两个模拟器上的优越表现。在六足机器人实验上,表现出了稳健性和样本效率。
完成下面两步后,将自动完成登录并继续当前操作。