用多语言编码器和知识蒸馏增强低资源的神经机器翻译:一个案例研究
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文介绍了一种基于预训练语言模型和知识蒸馏的seq2seq架构,用于辅助低资源语言的翻译。通过评估三种印度低资源语言的四个印度语之间的翻译效果,结果显示蓝-4和chrF相比基准有显著提高,人工评估也证实了该方法的有效性。
🎯
关键要点
- 本文介绍了一种基于预训练语言模型和知识蒸馏的seq2seq架构。
- 该架构用于辅助低资源语言的翻译,特别是mBART-50不支持的印度次大陆语言。
- 评估了三种印度低资源语言与四个印度语之间的翻译效果。
- 结果显示,蓝-4和chrF指标相比基准有显著提高。
- 人工评估证实了该方法的有效性。
➡️