评估社会一致性:人格驱动的大型语言模型是否像人类一样行为?

BriefGPT - AI 论文速递 BriefGPT - AI 论文速递 ·

本研究探讨了人格驱动的大型语言模型(LLMs)在社交情境中的表现,针对其行为是否符合设定的人格特征进行了评估。通过经典心理实验(如米尔格拉姆实验和最终通牒游戏),研究发现当前的LLMs在人格提示下存在行为失效,质疑了人格提示在今天的LLMs中的可行性。

阅读原文