本研究提出共享递归记忆变换器(SRMT),旨在解决多智能体强化学习中代理行为预测的挑战。SRMT通过汇聚个体工作记忆,促进代理间的信息交换与协调,实验结果表明其在复杂环境中显著提升了多智能体系统的协调能力。
完成下面两步后,将自动完成登录并继续当前操作。