开放语言数据倡议:推进低资源机器翻译以支持喀拉喀尔语
发表于: 。本研究针对喀拉喀尔语的机器翻译,填补了高质量平行语料库的缺口,通过创建乌兹别克-喀拉喀尔语、俄语-喀拉喀尔语和英语-喀拉喀尔语的平行语料库,以及针对这些语言的开源神经翻译模型,提出了一种新方法。实验结果显示,所提出的方法在实际应用中较现有基线有显著改善,助力喀拉喀尔语翻译的能力提升及自然语言处理技术的多样性发展。
本研究针对喀拉喀尔语的机器翻译,填补了高质量平行语料库的缺口,通过创建乌兹别克-喀拉喀尔语、俄语-喀拉喀尔语和英语-喀拉喀尔语的平行语料库,以及针对这些语言的开源神经翻译模型,提出了一种新方法。实验结果显示,所提出的方法在实际应用中较现有基线有显著改善,助力喀拉喀尔语翻译的能力提升及自然语言处理技术的多样性发展。