BriefGPT - AI 论文速递

BriefGPT - AI 论文速递 -

EthioMT:适用于低资源埃塞俄比亚语言的平行语料库

自然语言处理在机器翻译、新闻分类和问答等高资源语种的任务上取得了显著的性能,但对于低资源语种的机器翻译仍有待改善。本文介绍了 EthioMT,一个包含 15 种语言的新的平行语料库,同时收集了一份更为研究充分的语言在埃塞俄比亚的基准数据集,通过使用变压器和微调方法对 23 种埃塞俄比亚语言的新收集语料和基准数据集进行评估。

自然语言处理在高资源语种上表现出色,但低资源语种的机器翻译仍需改进。EthioMT是一个包含15种语言的新平行语料库,同时收集了埃塞俄比亚的基准数据集,通过使用变压器和微调方法对23种埃塞俄比亚语言的新收集语料和基准数据集进行评估。

EthioMT 低资源语种 机器翻译 自然语言处理 语料库 高资源语种

相关推荐 去reddit讨论

热榜 Top10

Dify.AI
Dify.AI
观测云
观测云
LigaAI
LigaAI
eolink
eolink

推荐或自荐