神经机器翻译中使用短语机制的有效方法

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

该研究探讨了在只有大型单语语料库的情况下学习翻译的方法,提出了神经模型和基于短语的模型,并通过参数初始化、语言模型去噪和反向迭代自动生成并行数据来提高翻译性能。在基准测试中,这些模型在英法和德英翻译中分别获得28.1和25.2的BLEU分数,比现有方法高出11个分数。在低资源语言如英乌和英罗马尼亚翻译中也取得了良好结果。

🎯

关键要点

  • 该研究探讨了在只有大型单语语料库的情况下学习翻译的方法。
  • 提出了神经模型和基于短语的模型。
  • 通过参数初始化、语言模型去噪和反向迭代自动生成并行数据来提高翻译性能。
  • 在WMT'14英法和WMT'16德英基准测试中,模型分别获得28.1和25.2的BLEU分数。
  • 这些分数比现有方法高出11个分数。
  • 在低资源语言如英乌和英罗马尼亚翻译中也取得了良好结果。
➡️

继续阅读