语言表征投射:我们能在多语言语言模型中跨语言转移事实知识吗?
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
研究发现,单纯使用翻译质量度量多语言神经机器翻译中的知识转移并不足够。研究提出了“表示转移潜力”(RTP)的概念,可测量正向和负向的迁移,并且RTP与翻译质量变化强相关。研究还发现多重并行重叠是一个重要而未被充分利用的特征,开发了一种新型训练方案,可提高低资源语言的翻译质量。
🎯
关键要点
- 单纯使用翻译质量度量多语言神经机器翻译中的知识转移并不足够。
- 引入了“表示转移潜力”(RTP)概念,用于衡量不同语言之间的表示相似性。
- RTP可测量正向和负向的迁移,并且与翻译质量变化强相关。
- 多重并行重叠是一个重要而未被充分利用的特征。
- 开发了一种新型训练方案,使用辅助相似性损失,鼓励表示在不同语言之间更具不变性。
- 这种方法可提高低资源语言的翻译质量。
➡️