心智理论中的情境理解本质:基于故事角色的问答研究
📝
内容提要
本研究解决了机器在心智理论(ToM)评估中对长个人背景理解的忽视问题,提出了一个新的基准CharToM-QA,包含1035个基于经典小说角色的ToM问题。研究表明,受过教育的参与者在阅读小说后表现显著提升,而先进的语言模型尽管经过相关故事的预训练,其表现仍显著低于人类,这凸显了当前语言模型在捕捉ToM推理所需的复杂情境信息方面的局限性。
➡️