通过分散相位振荡器学习新兴步态:关于观察、奖励和反馈的作用

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

本文提出了一种方法,将中心模式发生器(CPG)整合到深度强化学习(DRL)框架中,以产生稳健且全向的四足动物运动。模型可以调节振荡器的振幅和频率,并协调不同振荡器间的行为。通过 sim-to-real 转移至 Unitree A1 进行测试,发现模型行为的鲁棒性优于训练时未见过的干扰。该方法可以在没有领域随机化和少量反馈的情况下进行部署。

🎯

关键要点

  • 提出了一种将中心模式发生器(CPG)整合到深度强化学习(DRL)框架中的方法。
  • 该模型能够调节振荡器的振幅和频率,并协调不同振荡器间的行为。
  • 模型在模拟训练后,通过 sim-to-real 转移至 Unitree A1 进行测试。
  • 测试结果显示模型在面对未见过的干扰时表现出更好的鲁棒性。
  • 动态添加的负载为 13.75 公斤,代表 115% 的名义四足动物质量。
  • 框架可以在没有领域随机化和少量反馈的情况下进行部署,提供振荡器状态和触点布尔值。
➡️

继续阅读