小红花·文摘

本研究提出共享递归记忆变换器（SRMT），旨在解决多智能体强化学习中代理行为预测的挑战。SRMT通过汇聚个体工作记忆，促进代理间的信息交换与协调，实验结果表明其在复杂环境中显著提升了多智能体系统的协调能力。