本研究发现遮盖语言模型评估指标间相关性弱,MLM在精调期间仍会重新学习社会偏见。研究结果强调现有MLM偏见评估措施的局限性,并提出了在下游应用中部署MLM的问题。
完成下面两步后,将自动完成登录并继续当前操作。