古代韩国档案翻译:基于统计短语对齐、LLM 上下文学习和跨方法论方法的比较分析
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文提出了一种使用基于5-gram KenLM语言模型的缩放相似性分数的新方法,以提高机器翻译的质量。通过Kneser-ney平滑技术过滤域外数据,并采用多域、微调和迭代回译等自适应技术。实验证明,在Hindi-Nepali语言对上,该方法在多域、微调和迭代回译上分别提高了约2个BLEU点、3个BLEU点和2个BLEU点。
🎯
关键要点
- 提出了一种基于5-gram KenLM语言模型的缩放相似性分数的新方法。
- 使用Kneser-ney平滑技术过滤域外数据,以提高机器翻译质量。
- 采用多域、微调和迭代回译等自适应技术。
- 在Hindi-Nepali语言对上,该方法在多域上提高了约2个BLEU点。
- 在微调NMT方面提高了约3个BLEU点。
- 在迭代回译上提高了约2个BLEU点。
➡️