文本模型是否存在与性别相关语言无关的偏见?
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文提出了两个度量标准(skew和stereotype)来分析上下文语言模型在WinoBias代词消解任务中的性别偏见,并提出了两种减少偏见的方法。
🎯
关键要点
- 提出了两个度量标准:skew 和 stereotype,用于分析性别偏见。
- 这两个标准用于量化上下文语言模型在WinoBias代词消解任务中的表现。
- 提出了两种减少性别偏见的方法。
- 第一种方法是在线方法,能够有效消除偏斜,但牺牲了刻板印象。
- 第二种方法借鉴了ELMo的工作,使用增强的性别平衡数据集微调BERT,降低了skew和stereotype。
- 现有的性别偏见基准未能完全探测到专业偏见,代词消解可能受到其他性别偏见的交叉相关性影响。
➡️