不仅有奖励还有约束:应用于四肢机器人的运动

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

本文提出了一种基于模型的机器人运动框架,通过采集四足机器人数据并引入模型预测的损失函数,实现了准确建模机器人的动力学,使学习到的模型可以进行实时控制。此方法在样本效率上比当前的无模型方法提高了一个数量级以上。

🎯

关键要点

  • 提出了一种基于模型的机器人运动框架。
  • 通过采集4.5分钟的四足机器人数据实现步行。
  • 引入跟踪多个时间步长上的模型预测的损失函数。
  • 准确建模机器人的动力学,使学习到的模型可以进行实时控制。
  • 此方法在样本效率上比当前的无模型方法提高了一个数量级以上。
➡️

继续阅读