不仅有奖励还有约束:应用于四肢机器人的运动
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
本文提出了一种基于模型的机器人运动框架,通过采集四足机器人数据并引入模型预测的损失函数,实现了准确建模机器人的动力学,使学习到的模型可以进行实时控制。此方法在样本效率上比当前的无模型方法提高了一个数量级以上。
🎯
关键要点
- 提出了一种基于模型的机器人运动框架。
- 通过采集4.5分钟的四足机器人数据实现步行。
- 引入跟踪多个时间步长上的模型预测的损失函数。
- 准确建模机器人的动力学,使学习到的模型可以进行实时控制。
- 此方法在样本效率上比当前的无模型方法提高了一个数量级以上。
➡️