多源烟羽追踪的多智能体强化学习
本研究解决了在复杂的涡流条件下烟羽追踪算法不准确的问题,提出了一种基于多智能体强化学习(MARL)的新方法。该方法利用长短期记忆网络(LSTM)处理历史动作-观察对,从而有效地近似潜在状态,并在复杂环境中实现了显著的性能提升,具体显示出仅需探索1.29%的环境,即可成功定位污染源。
本研究解决了在复杂的涡流条件下烟羽追踪算法不准确的问题,提出了一种基于多智能体强化学习(MARL)的新方法。该方法利用长短期记忆网络(LSTM)处理历史动作-观察对,从而有效地近似潜在状态,并在复杂环境中实现了显著的性能提升,具体显示出仅需探索1.29%的环境,即可成功定位污染源。