隐性偏见:社会观点不一致对隐性和显性意见的影响程度
原文中文,约300字,阅读约需1分钟。发表于: 。本研究探讨隐性语言对大语言模型偏见放大的影响,针对当前偏见识别方法的不足。在轴心任务中,我们发现大语言模型在识别隐性和显性意见时存在绩效差异,显性意见偏向明显。此外,偏见一致模型在对待社会敏感话题时产生更谨慎的反应,从而推动了对其决策过程和可信度的进一步改进。
最近的研究发现,预训练的大型语言模型(LLMs)具有类似于人类认知结构的特点。研究人员通过调查LLMs中的社会偏见现象,发现了一个并行现象,即“重新判断不一致”。这一发现可能意味着随着LLMs能力的增强,不同的认知结构也会出现。利用心理学理论可以深入了解LLMs中显性和隐性结构的表达机制。