利用目标语言单语语料库进行计算机辅助翻译的跨语言神经模糊匹配

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文介绍了一种使用5-gram KenLM语言模型的新方法,通过Kneser-ney平滑技术过滤域外数据,提高机器翻译质量。同时采用多域、微调和迭代回译等自适应技术,在Hindi-Nepali语言对上提高了BLEU点数。

🎯

关键要点

  • 提出了一种基于5-gram KenLM语言模型的新方法。
  • 使用Kneser-ney平滑技术过滤域外数据,以提高机器翻译质量。
  • 采用多域、微调和迭代回译等自适应技术。
  • 在Hindi-Nepali语言对上,方法在NMT和SMT上效果显著。
  • 多域方法增加约2个BLEU点,微调NMT提高约3个BLEU点,迭代回译提高约2个BLEU点。
➡️

继续阅读