用多语言编码器和知识蒸馏增强低资源的神经机器翻译:一个案例研究

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文介绍了一种基于预训练语言模型和知识蒸馏的seq2seq架构,用于辅助低资源语言的翻译。通过评估三种印度低资源语言的四个印度语之间的翻译效果,结果显示蓝-4和chrF相比基准有显著提高,人工评估也证实了该方法的有效性。

🎯

关键要点

  • 本文介绍了一种基于预训练语言模型和知识蒸馏的seq2seq架构。
  • 该架构用于辅助低资源语言的翻译,特别是mBART-50不支持的印度次大陆语言。
  • 评估了三种印度低资源语言与四个印度语之间的翻译效果。
  • 结果显示,蓝-4和chrF指标相比基准有显著提高。
  • 人工评估证实了该方法的有效性。
➡️

继续阅读