小红花·文摘

本文综述了强化学习在连续控制，特别是无人机控制中的应用。研究表明，基于模型的方法在样本复杂度上优于无模型方法，并提出了新型轨迹跟踪器和监督强化学习控制方法，显著提升了在复杂环境中的性能。通过数据驱动方法优化控制参数，展示了强化学习在实际物理系统中的有效性。