本研究提出了两种新算法,解决持续学习中的标签和实例噪声问题。通过构建噪声容忍的重放缓冲区,实验证明这些方法在噪声环境下显著提高了分类准确性,并有效减少了遗忘现象。
该研究使用深度强化学习控制无人机群,提供重放缓冲区来改善性能,并实现了对邻居机器人和障碍物交互的注意机制。在模拟环境中可实现32架机器人并达到80%的障碍物密度,在实际物理环境中可实现8架机器人并达到20%的障碍物密度,可零-shot地转移到真实的无人机上。
完成下面两步后,将自动完成登录并继续当前操作。