EthioMT:适用于低资源埃塞俄比亚语言的平行语料库
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
自然语言处理在高资源语种上表现出色,但低资源语种的机器翻译仍需改进。EthioMT是一个包含15种语言的新平行语料库,同时收集了埃塞俄比亚的基准数据集,通过使用变压器和微调方法对23种埃塞俄比亚语言的新收集语料和基准数据集进行评估。
🎯
关键要点
- 自然语言处理在高资源语种上表现出色。
- 低资源语种的机器翻译仍需改进。
- EthioMT是一个包含15种语言的新平行语料库。
- 收集了埃塞俄比亚的基准数据集。
- 使用变压器和微调方法评估23种埃塞俄比亚语言的新收集语料和基准数据集。
➡️