本文探讨了模型预测控制与强化学习的结合,提出了多种算法(如PPO和DMPO)在四旋翼飞行器控制中的应用。研究表明,基于模型的方法在样本复杂度上优于无模型方法,且DMPO在性能和内存使用上表现出色。此外,新型参数化控制器在解释性和性能上优于传统控制器,展示了实际应用的潜力。
完成下面两步后,将自动完成登录并继续当前操作。