小红花·文摘

本研究针对当前Overcooked游戏作为零样本协调基准的不足之处，提出了一种状态增强机制以提高训练分布的状态覆盖率。研究结果表明，协调失败主要源于自主游戏过程中的状态覆盖不足，而非复杂的协调挑战，并提出新的OvercookedV2基准，以促进AI代理与人类的协作和协调算法的发展。