学习充电:通过深度强化学习进行无人机覆盖路径规划
原文中文,约300字,阅读约需1分钟。发表于: 。通过利用基于地图的观测、动作掩码和折扣因子调度的近端策略优化(PPO)深度强化学习(DRL)方法,尤其考虑充电航程的整体覆盖策略中复杂长期决策的问题,本研究提出了一种解决无人机有限电池的电量限制覆盖路径规划(CPP)问题的新方法,提供了处理由充电能力引起的紧急状态循环的位置历史,超越了基线启发式算法,并对长期问题的 DRL 算法设计提供了有价值的见解,并为 CPP 问题提供了一个可公开使用的软件框架。
本研究提出了一种解决无人机电量限制覆盖路径规划问题的新方法,利用PPO深度强化学习方法,超越了基线启发式算法,并提供了一个可公开使用的软件框架。