小红花·文摘

本文介绍了多智能体强化学习（MARL）的新方法，如REFIL、CTRL和MABE，旨在提高学习效率和泛化能力。这些方法在复杂环境下的应用表现优异，尤其在自动驾驶和战斗仿真中显著提升了训练效率和适应性。