本文探讨了大型语言模型在心智理论(ToM)能力方面的研究现状,指出现有研究忽视了深度思考的步骤,并提出了一种新评估方法,以全面评估ToM能力,尤其是在动态环境中的应用。
完成下面两步后,将自动完成登录并继续当前操作。