自主赛车的极限探索:最优控制与强化学习
原文中文,约400字,阅读约需1分钟。发表于: 。本文研究如何为一个敏捷移动机器人设计一个控制系统,重点研究了一项具有挑战性的场景:自主无人机赛车。我们证明了在这个场景中,通过强化学习(RL)训练的神经网络控制器优于最优控制(OC)方法。我们的研究表明,RL 胜过 OC 的基本优势不是在于更好地优化了其目标,而是优化了一个更好的目标。RL...
本文研究了为敏捷移动机器人设计控制系统,重点研究了自主无人机赛车场景。研究表明,强化学习训练的神经网络控制器优于最优控制方法。强化学习可以直接优化任务级目标,并能够利用领域随机化来应对模型不确定性,从而发现更稳健的控制响应。本研究对于推动敏捷机器人的最大性能具有重要意义,并阐明了强化学习和最优控制在机器人控制中的作用。