它们是否指的是 ' 我们 '? 解释不同群体偏见中的指代表达
原文中文,约400字,阅读约需1分钟。发表于: 。通过在英语体育评论中对隶属群体内外言论(群体偏见)的模型,本文揭示了在社会现象如刻板印象延续和隐性偏见中可能存在的微妙差异。为了大规模分析群体间变化,我们使用 LLMs 进行自动标记,并发现一些 LLMs 最佳工作方式是在评论时使用语言描述赢得概率,而不是数值概率。此外,使用 LLMs 对评论进行大规模标记揭示了在不同赢得概率下区别隶属群体内外言论形式的线性变化。
研究发现大型语言模型(LLMs)存在与社会群体刻板属性相关的偏见,特别是对非洲裔、亚洲裔和拉美裔美国人的描绘。女性比男性更具同质性,但差异较小。性别的影响在种族/民族群体中存在差异。研究推测这种偏见可能放大未来LLM训练中的偏见并强化刻板印象。