小红花·文摘

本文介绍了一种全学习的层次化框架，可以同时学习低层控制器和高层潜在动作空间，并对多个机器人的运动进行泛化。通过模型预测控制方法计划连续潜在动作，成功实现了多个任务和两个模拟器上的优越表现。在六足机器人实验上，表现出了稳健性和样本效率。