使用因果干预分析展示,Transformers可以线性、可解释地表示某些语言特征。BERT的动词变位能力依赖于一种线性编码的主语数量,可以在第一层和最后一层位置操纵并影响变位准确性。该编码在中间层位置分布在多个位置之间。
完成下面两步后,将自动完成登录并继续当前操作。