小红花·文摘

本研究发现遮盖语言模型评估指标间相关性弱，MLM在精调期间仍会重新学习社会偏见。研究结果强调现有MLM偏见评估措施的局限性，并提出了在下游应用中部署MLM的问题。