性别与职业在大型语言模型表示中的相互影响
📝
内容提要
本研究探讨了大型语言模型(LLM)中,名字符号的性别与职业背景之间的相互作用,揭示了职场和名字的性别感知如何相互影响。研究发现,LLM 的名字性别表征与现实世界中的性别统计数据相关,并受到刻板印象中女性或男性职业的共现影响。研究结果对偏见检测方法的发展具有重要意义,但在可靠使用这些内部性别表征检测偏见方面仍面临挑战。
🏷️
标签
➡️