本文探讨了大型语言模型在心智理论(ToM)能力方面的研究现状,指出现有研究忽视了深度思考的步骤,并提出了一种新评估方法,以全面评估ToM能力,尤其是在动态环境中的应用。
本文探讨了大型语言模型在心智理论能力方面的研究现状。
现有研究通常只关注心智理论任务的第二步,忽视了深度思考的步骤。
提出了一种新的评估方法,以全面评估ToM能力。
新评估方法特别关注动态环境中的ToM能力应用。
旨在推动心智理论研究的发展。
完成下面两步后,将自动完成登录并继续当前操作。