本研究探讨了多代理强化学习中代理与人类的协调问题。通过学习人类合作伙伴的生成模型,提出了一种新方法,能够生成多样化的合作伙伴,从而提升代理的协作能力。实验结果表明,该方法在真实人类团队中的表现持续改善。
完成下面两步后,将自动完成登录并继续当前操作。