小红花·文摘

本文探讨了上下文语言模型在代词消解任务中的性别偏见，提出了skew和stereotype两个度量标准。研究通过在线方法和增强性别平衡数据集微调BERT，以减少偏见，发现现有基准未能完全探测专业偏见。提出了MISGENDERED框架评估性别中性人称的使用，发现基于二元性别训练的模型存在误差。同时，研究提出了GenderCARE框架，有效减少性别偏见并保持模型性能。