本文提出了skew和stereotype两个度量标准,分析了上下文语言模型在WinoBias代词消解任务中的性别偏见,并探讨了两种减少偏见的方法:在线方法和基于增强性别平衡数据集的BERT微调。研究表明,现有基准未能充分检测专业偏见。
完成下面两步后,将自动完成登录并继续当前操作。