基于策略的演员-评论家强化学习用于多无人机探索

💡 原文中文,约2200字,阅读约需6分钟。
📝

内容提要

本研究提出了一种基于策略的强化学习方法,用于解决多无人机在未知环境中的探索挑战。该方法结合了近端策略优化和深度卷积神经网络与长短期记忆。实验证明该方法在避免碰撞的同时能够有效完成覆盖任务。

🎯

关键要点

  • 本研究提出了一种基于策略的强化学习方法,解决多无人机在未知环境中的探索挑战。
  • 该方法结合了近端策略优化(PPO)和深度卷积神经网络(CNN)与长短期记忆(LSTM)。
  • 实验证明该方法在避免碰撞的同时能够有效完成覆盖任务。
  • 该方法在不同地图中表现出更优的探索能力,优于其他强化学习技术。
➡️

继续阅读