小红花·文摘

本文研究了为敏捷移动机器人设计控制系统，重点研究了自主无人机赛车场景。研究表明，强化学习训练的神经网络控制器优于最优控制方法。强化学习可以直接优化任务级目标，并能够利用领域随机化来应对模型不确定性，从而发现更稳健的控制响应。本研究对于推动敏捷机器人的最大性能具有重要意义，并阐明了强化学习和最优控制在机器人控制中的作用。