通过自主车辆扩展水下声学跟踪的多智能体强化学习 本研究解决了多目标跟踪和快速不可预测运动目标的计算挑战,提出了一种迭代蒸馏方法,将高保真模拟转化为简化的GPU加速环境,同时保持高层次动态。研究结果表明,提出的方法在跟踪精度上保持误差低于5米,为自主车队控制提供了可扩展的框架,显著提升了样本效率。 本研究提出了一种迭代蒸馏方法,旨在解决多目标跟踪和快速运动目标的计算挑战,同时保持高精度(误差低于5米),为自主车队控制提供可扩展框架。 多智能体 多目标跟踪 强化学习 快速运动目标 自主车队 迭代蒸馏 高精度