本文探讨了心智理论(ToM)在人工智能中的应用,特别是大型语言模型(LLMs)在理解人类心理状态方面的局限性。研究提出了多模式心智问答基准(MMToM-QA)和新方法BIP-ALM,以评估机器的心智理解能力。实验结果显示,尽管LLMs在某些任务上表现良好,但仍缺乏强大的心智理解能力,指出了未来研究的方向。
完成下面两步后,将自动完成登录并继续当前操作。