该研究使用因果中介分析理论,研究了预先训练的Transformer语言模型中性别偏差的机制。研究发现性别偏差效应分布稀疏,集中在网络的小部分,并且能被不同的中介子部件放大或抑制,同时也可以通过中介子的直接和间接影响进行分解。
完成下面两步后,将自动完成登录并继续当前操作。