EthioMT:适用于低资源埃塞俄比亚语言的平行语料库

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

自然语言处理在高资源语种上表现出色,但低资源语种的机器翻译仍需改进。EthioMT是一个包含15种语言的新平行语料库,同时收集了埃塞俄比亚的基准数据集,通过使用变压器和微调方法对23种埃塞俄比亚语言的新收集语料和基准数据集进行评估。

🎯

关键要点

  • 自然语言处理在高资源语种上表现出色。
  • 低资源语种的机器翻译仍需改进。
  • EthioMT是一个包含15种语言的新平行语料库。
  • 收集了埃塞俄比亚的基准数据集。
  • 使用变压器和微调方法评估23种埃塞俄比亚语言的新收集语料和基准数据集。
➡️

继续阅读