小红花·文摘

中国具身模型狂揽全球第一！机器人的人类数据时代来了

量子位 ·

本文证明了混合策略纳什均衡模型收敛于混合策略社交导航游戏的纳什均衡，并提出了一个基于数据驱动的框架，通过将代理策略初始化为从人类数据集中学得的高斯过程来构建游戏。基于提出的混合策略纳什均衡模型，开发了一个基于采样的群体导航框架，在模拟环境和非结构化环境中的真实人类数据集上评估，结果优于非学习和基于学习的方法，并达到了人类水平的群体导航性能。

人群导航的混合策略纳什均衡

BriefGPT - AI 论文速递 ·