古代韩国档案翻译:基于统计短语对齐、LLM 上下文学习和跨方法论方法的比较分析

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文提出了一种使用基于5-gram KenLM语言模型的缩放相似性分数的新方法,以提高机器翻译的质量。通过Kneser-ney平滑技术过滤域外数据,并采用多域、微调和迭代回译等自适应技术。实验证明,在Hindi-Nepali语言对上,该方法在多域、微调和迭代回译上分别提高了约2个BLEU点、3个BLEU点和2个BLEU点。

🎯

关键要点

  • 提出了一种基于5-gram KenLM语言模型的缩放相似性分数的新方法。
  • 使用Kneser-ney平滑技术过滤域外数据,以提高机器翻译质量。
  • 采用多域、微调和迭代回译等自适应技术。
  • 在Hindi-Nepali语言对上,该方法在多域上提高了约2个BLEU点。
  • 在微调NMT方面提高了约3个BLEU点。
  • 在迭代回译上提高了约2个BLEU点。
➡️

继续阅读