本研究提出了一种基于策略的强化学习方法,用于解决多无人机在未知环境中的探索挑战。该方法结合了近端策略优化和深度卷积神经网络与长短期记忆。实验证明该方法在避免碰撞的同时能够有效完成覆盖任务。
完成下面两步后,将自动完成登录并继续当前操作。