研究了心理状态表征的鲁棒性和记忆问题,以及提示变化对心智任务的影响。发现增加模型大小和微调方法可以提高模型对他人信念的内部表征质量。模型对提示的变化非常敏感,即使这些变化本应有益。通过引导模型的激活,可以成功改善模型的推理性能,无需训练任何探测器。
大型语言模型(LLMs)对个性测试的反应存在系统偏差,不能像人类测试结果一样解释。设计用于“引导”LLMs模拟特定个性类型的提示变化也不遵循人类样本中的五个独立个性因素。因此,在对LLMs的“个性”进行结论之前,应更加关注测试的有效性。
完成下面两步后,将自动完成登录并继续当前操作。