PersuasiveToM:评估机器心智理论在说服对话中的基准
📝
内容提要
本研究旨在解决当前机器学习模型在评估心智理论(ToM)方面的不足,尤其是在说服对话中的应用。提出的新基准PersuasiveToM通过设计两类问题,分别评估模型对心理状态的推理能力和应用能力,发现尽管模型在多个问题上表现良好,但在理解复杂心理状态的动态变化方面仍显不足。这项工作有望为评估LLMs的心智理论能力提供新的视角。
➡️