探索语言相似性和零样本学习用于德拉维多语言的多语种翻译
原文中文,约200字,阅读约需1分钟。发表于: 。通过利用音译和语言相似性,本研究构建了一个单一编解码器神经机器翻译系统,用于 Dravidian-Dravidian 多语言翻译和零翻译;通过限制词汇表使用优化传输技术,该模型在训练语言方向的 50%上达到了与大型基于引导的模型相差 3 个 BLEU 的分数。
本研究提出了一种有效缓解多语言神经机器翻译中零翻译问题的方法,通过移除编码器层中的残差连接,使模型表示更加与特定语言对应。在零翻译任务中,我们获得了18.5个BLEU点的提升,并在其他有监督的翻译中保持了高质量表现。通过对隐藏层输出的检查,我们证明了该方法能够获得更多的语言无关性。