本研究提出了一种通用基础设施和工作流,旨在解决在非结构化户外环境中应用深度强化学习于四旋翼的问题。该平台实现了训练到现实部署的无缝转移,显著提升了四旋翼在复杂环境中的飞行性能和适应性,并通过实证验证了其效率和鲁棒性。
该研究提出了一种课程学习方法,解决了传统强化学习在四旋翼稳定控制中的样本效率低和任务复杂性高的问题。通过逐步增加任务复杂性和引入新奖励函数,结果表明该方法在性能和鲁棒性上优于单阶段策略,同时降低了计算资源需求和收敛时间。
完成下面两步后,将自动完成登录并继续当前操作。