扩展FLORES+基准以适应更多低资源环境:葡萄牙语-埃马库瓦机器翻译评估

💡 原文约100字/词,阅读约需1分钟。
📝

内容提要

AfroMT是一个针对非洲8种使用广泛的机器翻译基准,提出了低资源预训练的可能性,并展示了数据受限情况下的改进结果。

🎯

关键要点

  • AfroMT是针对非洲8种广泛使用的机器翻译基准。
  • 该基准标准、干净且可重现。
  • 开发了一套分析工具用于诊断系统。
  • 探讨了低资源预训练的可能性。
  • 提出了两种基于数据增强的策略。
  • 在11种语言预训练的情况下,数据受限情况下提高了12 BLEU分数。
➡️

继续阅读