小红花·文摘

本文探讨了心智理论（ToM）在人工智能中的应用，特别是大型语言模型（LLMs）在理解人类心理状态方面的局限性。研究提出了多模式心智问答基准（MMToM-QA）和新方法BIP-ALM，以评估机器的心智理解能力。实验结果显示，尽管LLMs在某些任务上表现良好，但仍缺乏强大的心智理解能力，指出了未来研究的方向。