小红花·文摘

本研究探讨了多代理强化学习中代理与人类的协调问题。通过学习人类合作伙伴的生成模型，提出了一种新方法，能够生成多样化的合作伙伴，从而提升代理的协作能力。实验结果表明，该方法在真实人类团队中的表现持续改善。