多智能体强化学习下的动态避障无人机路径规划

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

该研究使用深度强化学习控制无人机群,提供重放缓冲区来改善性能,并实现了对邻居机器人和障碍物交互的注意机制。在模拟环境中可实现32架机器人并达到80%的障碍物密度,在实际物理环境中可实现8架机器人并达到20%的障碍物密度,可零-shot地转移到真实的无人机上。

🎯

关键要点

  • 提出一种使用端到端深度强化学习控制无人机群的方法。
  • 通过提供重放缓冲区来改善性能,剪辑碰撞情景。
  • 实现了对邻居机器人和障碍物交互的注意机制。
  • 首次成功将该机制应用于计算资源受限的硬件上。
  • 在模拟环境中可实现32架机器人,障碍物密度达到80%。
  • 在实际物理环境中可实现8架机器人,障碍物密度达到20%。
  • 该方法可以零-shot地转移到真实的无人机上。
➡️

继续阅读