评估社会一致性：人格驱动的大型语言模型是否像人类一样行为？

BriefGPT - AI 论文速递 ·

本研究探讨了人格驱动的大型语言模型（LLMs）在社交情境中的表现，针对其行为是否符合设定的人格特征进行了评估。通过经典心理实验（如米尔格拉姆实验和最终通牒游戏），研究发现当前的LLMs在人格提示下存在行为失效，质疑了人格提示在今天的LLMs中的可行性。

一致性大型语言模型