哪个人在数学上更优秀,Jenny 还是 Jingzhen?揭示大型语言模型中的刻板印象
原文中文,约400字,阅读约需1分钟。发表于: 。大型语言模型(LLMs)被证明会传播和放大有害的刻板印象,尤其是那些对边缘化社群产生不成比例影响的刻板印象。为了更全面地理解这些刻板印象的影响,我们介绍了 GlobalBias 数据集,该数据集包括 40 个独特的性别 - 种族群体以及刻板印象文献中通常使用的描述词,使我们能够研究世界各地的一系列刻板印象。我们使用 GlobalBias...
大型语言模型(LLMs)会传播和放大有害的刻板印象,特别是对边缘化社群。研究者使用GlobalBias数据集测试了一套语言模型,并发现模型输出中存在刻板印象。即使禁止,更大的模型仍然显示出更高水平的刻板印象输出。