本文综述了强化学习在连续控制,特别是无人机控制中的应用。研究表明,基于模型的方法在样本复杂度上优于无模型方法,并提出了新型轨迹跟踪器和监督强化学习控制方法,显著提升了在复杂环境中的性能。通过数据驱动方法优化控制参数,展示了强化学习在实际物理系统中的有效性。
完成下面两步后,将自动完成登录并继续当前操作。