变形金刚中的动词变位是由主语数量的线性编码决定的
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
使用因果干预分析展示,Transformers可以线性、可解释地表示某些语言特征。BERT的动词变位能力依赖于一种线性编码的主语数量,可以在第一层和最后一层位置操纵并影响变位准确性。该编码在中间层位置分布在多个位置之间。
🎯
关键要点
- 使用因果干预分析展示深层架构如Transformers是可解释的,而非不透明的黑盒。
- BERT的动词变位能力依赖于一种线性编码的主语数量。
- 主语在第一层和最后一层的位置可以操纵并影响动词变位的准确性。
- 在中间层位置,编码分布在多个位置之间,尤其是在有多个主语序号线索时。
🏷️
标签
➡️