性别与职业在大型语言模型表示中的相互影响

📝

内容提要

本研究探讨了大型语言模型(LLM)中,名字符号的性别与职业背景之间的相互作用,揭示了职场和名字的性别感知如何相互影响。研究发现,LLM 的名字性别表征与现实世界中的性别统计数据相关,并受到刻板印象中女性或男性职业的共现影响。研究结果对偏见检测方法的发展具有重要意义,但在可靠使用这些内部性别表征检测偏见方面仍面临挑战。

🏷️

标签

➡️

继续阅读