理解对资源有限的神经机器翻译中的词级语言标注的影响

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

本研究使用Transformer模型和大型语料库提高句法知识表征,通过多任务学习进行数据操纵或使用专用模型组件。结果显示,采用线性树而不是真实依赖的增益并非来自语言知识增加,而是由于自注意矩阵上的简单正则化效应。

🎯

关键要点

  • 本研究使用Transformer模型和大型语料库提高句法知识表征。
  • 研究利用多任务学习进行数据操纵或使用专用模型组件。
  • 结果显示,采用线性树而不是真实依赖的增益并非来自语言知识的增加。
  • 增益是由于自注意矩阵上的简单正则化效应。
➡️

继续阅读