本研究针对当前Overcooked游戏作为零样本协调基准的不足之处,提出了一种状态增强机制以提高训练分布的状态覆盖率。研究结果表明,协调失败主要源于自主游戏过程中的状态覆盖不足,而非复杂的协调挑战,并提出新的OvercookedV2基准,以促进AI代理与人类的协作和协调算法的发展。
上海交通大学SJTU-MARL实验室与AGI-Eval社区联合开发的DPT-Agent框架旨在提升大模型与人类的实时协作能力。该框架结合双过程理论,实现了快速响应与复杂策略思考的平衡,特别在《Overcooked》游戏中展现了强大的协作能力和灵活的动态分工,已开源并支持多种模型评估,推动人机协作研究。
完成下面两步后,将自动完成登录并继续当前操作。