神经机器翻译中使用短语机制的有效方法
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
该研究探讨了在只有大型单语语料库的情况下学习翻译的方法,提出了神经模型和基于短语的模型,并通过参数初始化、语言模型去噪和反向迭代自动生成并行数据来提高翻译性能。在基准测试中,这些模型在英法和德英翻译中分别获得28.1和25.2的BLEU分数,比现有方法高出11个分数。在低资源语言如英乌和英罗马尼亚翻译中也取得了良好结果。
🎯
关键要点
- 该研究探讨了在只有大型单语语料库的情况下学习翻译的方法。
- 提出了神经模型和基于短语的模型。
- 通过参数初始化、语言模型去噪和反向迭代自动生成并行数据来提高翻译性能。
- 在WMT'14英法和WMT'16德英基准测试中,模型分别获得28.1和25.2的BLEU分数。
- 这些分数比现有方法高出11个分数。
- 在低资源语言如英乌和英罗马尼亚翻译中也取得了良好结果。
➡️