CORD:通过角色多样性实现可推广的合作

📝

内容提要

本研究针对合作多智能体强化学习中的泛化问题展开,现有方法在训练智能体时往往导致过拟合,难以在未见过的合作伙伴中应用。本文提出的CORD方法,通过层次化结构和角色多样性,促进了智能体之间的合理角色分配,从而提升了在各种合作任务中的表现,特别是在泛化测试中的优势。

➡️

继续阅读