本研究提出了一种轻量级深度强化学习方法,旨在解决固定翼无人机在未知低空环境中的障碍物避让问题,能够实时检测障碍物,效果优于现有技术。
本文探讨了固定翼无人机在结构损坏或执行器失效时的信息处理问题。提出的基于变换器的控制方法通过上下文学习和注意机制,将外部参考值直接映射为控制命令,从而提高了跟踪精度和稳定性,增强了无人机的安全性和可靠性。
本文比较了无模型和基于模型的强化学习在固定翼无人机姿态控制中的表现。研究表明,时间差模型预测控制在跟踪精度和鲁棒性上优于PID控制器和其他无模型方法,尤其在非线性飞行中表现突出。还引入了激励波动作为评估能效和执行器磨损的重要指标。
完成下面两步后,将自动完成登录并继续当前操作。