本文提出了一种新方法——可微分代理间变换器(DIAT),旨在解决多智能体强化学习中的可解释性问题。DIAT通过自注意力机制学习人类可理解的通信协议,实验结果表明其在复杂环境中有效完成合作任务,展示了可解释通信的潜力。
完成下面两步后,将自动完成登录并继续当前操作。