小红花·文摘

本研究提出了一种新的零样本人机协调方法，解决了未知环境中的泛化能力问题。通过改进效用函数和合作玩家采样策略，显著提升了自我代理与人类的协调性能，实验结果优于其他基线模型。