本文介绍了克里奥尔语言的机器翻译研究,提供了最大的克里奥尔语数据集和41种语言的翻译模型,旨在提升克里奥尔语言的自然语言处理能力。CreoleVal基准数据集涵盖28种克里奥尔语言,促进技术包容性。MorisienMT数据集用于评估毛里求斯克里奥尔语的翻译质量,公开用于研究。
CreoleVal是一个包含8种不同自然语言处理任务的基准数据集的集合,涵盖了28种克里奥尔语言。通过零-shot设置下的基准实验,进一步确定了克里奥尔语言的迁移学习能力和局限性。
完成下面两步后,将自动完成登录并继续当前操作。