Nko 机器翻译:工具、语料库和基准结果

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

该研究提供了一份包含25,421组句子对和697个高质量的众包句子的平行机器翻译训练语料库,用于英语和Akuapem Twi。研究使用fine-tune transformer翻译模型在该语料库上进行训练,并推荐该数据集用于Akuapem Twi机器翻译的进一步训练和评估。

🎯

关键要点

  • 本研究提供了一份用于英语和Akuapem Twi的平行机器翻译训练语料库。
  • 该语料库包含25,421组句子对。
  • 研究使用Transformer为基础的翻译器生成初始的Akuapem Twi翻译。
  • 翻译经过母语为Akuapem Twi的人验证和校对,以消除翻译错误。
  • 提供了697个高质量的众包句子,作为评估集用于下游自然语言处理任务。
  • 研究通过fine-tune transformer翻译模型在该训练语料库上进行训练。
  • 在众包测试集上进行性能基准测试。
  • 推荐该数据集用于Akuapem Twi机器翻译的进一步训练和评估。
➡️

继续阅读