本研究提出了ToMATO基准,以解决现有心智理论测试的不足。通过角色扮演生成对话,捕捉多种心智状态,发现虚假信念的生成普遍存在,并且人格特征显著影响模型表现。
该研究在Minecraft环境中使用概率图模型推理人类信念,发现玩家行为受到视野和信念的影响。AI代理商ToMCAT在推断虚假信念方面表现优异。
完成下面两步后,将自动完成登录并继续当前操作。