不仅有奖励还有约束:应用于四肢机器人的运动
原文中文,约200字,阅读约需1分钟。
📝
内容提要
本文提出了一种基于模型的机器人运动框架,通过采集四足机器人数据并引入模型预测的损失函数,实现了准确建模机器人的动力学,使学习到的模型可以进行实时控制。此方法在样本效率上比当前的无模型方法提高了一个数量级以上。
🎯
关键要点
-
提出了一种基于模型的机器人运动框架。
-
通过采集4.5分钟的四足机器人数据实现步行。
-
引入跟踪多个时间步长上的模型预测的损失函数。
-
准确建模机器人的动力学,使学习到的模型可以进行实时控制。
-
此方法在样本效率上比当前的无模型方法提高了一个数量级以上。
🏷️