无模型的复杂动态轨迹跟踪控制与机器学习

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文介绍了一种结合时间变化的线性高斯策略的强化学习方法,通过模型有关算法与模型无关框架相结合,提高实时机器人应用的模型效率和数据效率。该方法可以解决具有挑战性的操作任务,表现与模型无关方法相比具有可比性或更好的表现,同时保持模型有关方法的样本效率。

🎯

关键要点

  • 本文研究结合时间变化的线性高斯策略的强化学习方法。
  • 该方法结合了模型有关算法与模型无关框架。
  • 通过训练深度神经网络等任意参数策略,提高实时机器人应用的模型效率和数据效率。
  • 研究表明,该方法在解决具有挑战性的操作任务方面表现优异。
  • 该方法的表现与模型无关方法相比具有可比性或更好的表现。
  • 同时保持了模型有关方法的样本效率。
➡️

继续阅读