小红花·文摘

本文探讨了模型预测控制与强化学习的结合，提出了多种算法（如PPO和DMPO）在四旋翼飞行器控制中的应用。研究表明，基于模型的方法在样本复杂度上优于无模型方法，且DMPO在性能和内存使用上表现出色。此外，新型参数化控制器在解释性和性能上优于传统控制器，展示了实际应用的潜力。