该研究使用深度强化学习控制无人机群,提供重放缓冲区来改善性能,并实现了对邻居机器人和障碍物交互的注意机制。在模拟环境中可实现32架机器人并达到80%的障碍物密度,在实际物理环境中可实现8架机器人并达到20%的障碍物密度,可零-shot地转移到真实的无人机上。
完成下面两步后,将自动完成登录并继续当前操作。