多智能体强化学习下的动态避障无人机路径规划
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
该研究使用深度强化学习控制无人机群,提供重放缓冲区来改善性能,并实现了对邻居机器人和障碍物交互的注意机制。在模拟环境中可实现32架机器人并达到80%的障碍物密度,在实际物理环境中可实现8架机器人并达到20%的障碍物密度,可零-shot地转移到真实的无人机上。
🎯
关键要点
- 提出一种使用端到端深度强化学习控制无人机群的方法。
- 通过提供重放缓冲区来改善性能,剪辑碰撞情景。
- 实现了对邻居机器人和障碍物交互的注意机制。
- 首次成功将该机制应用于计算资源受限的硬件上。
- 在模拟环境中可实现32架机器人,障碍物密度达到80%。
- 在实际物理环境中可实现8架机器人,障碍物密度达到20%。
- 该方法可以零-shot地转移到真实的无人机上。
➡️