变形金刚中的动词变位是由主语数量的线性编码决定的

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

使用因果干预分析展示,Transformers可以线性、可解释地表示某些语言特征。BERT的动词变位能力依赖于一种线性编码的主语数量,可以在第一层和最后一层位置操纵并影响变位准确性。该编码在中间层位置分布在多个位置之间。

🎯

关键要点

  • 使用因果干预分析展示深层架构如Transformers是可解释的,而非不透明的黑盒。
  • BERT的动词变位能力依赖于一种线性编码的主语数量。
  • 主语在第一层和最后一层的位置可以操纵并影响动词变位的准确性。
  • 在中间层位置,编码分布在多个位置之间,尤其是在有多个主语序号线索时。
➡️

继续阅读