它们是否指的是 ' 我们 '? 解释不同群体偏见中的指代表达
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
研究发现大型语言模型(LLMs)存在与社会群体刻板属性相关的偏见,特别是对非洲裔、亚洲裔和拉美裔美国人的描绘。女性比男性更具同质性,但差异较小。性别的影响在种族/民族群体中存在差异。研究推测这种偏见可能放大未来LLM训练中的偏见并强化刻板印象。
🎯
关键要点
- 大型语言模型(LLMs)存在与社会群体刻板属性相关的偏见。
- LLMs 将非洲裔、亚洲裔和拉美裔美国人描绘为比白人更具同质性。
- 女性比男性更具同质性,但差异较小。
- 性别的影响在不同种族/民族群体中存在差异。
- 非洲裔和拉美裔美国人中性别的影响一致,而在亚洲裔和白人中不一致。
- 这种偏见可能放大未来LLM训练中的偏见并强化刻板印象。
➡️