本文探讨了上下文语言模型在代词消解任务中的性别偏见,提出了skew和stereotype两个度量标准。研究通过在线方法和增强性别平衡数据集微调BERT,以减少偏见,发现现有基准未能完全探测专业偏见。提出了MISGENDERED框架评估性别中性人称的使用,发现基于二元性别训练的模型存在误差。同时,研究提出了GenderCARE框架,有效减少性别偏见并保持模型性能。
本文提出了两个度量标准(skew和stereotype)来分析上下文语言模型在WinoBias代词消解任务中的性别偏见,并提出了两种减少偏见的方法。
完成下面两步后,将自动完成登录并继续当前操作。