我们通过爬取广泛的语音语料库并应用数据增强方法,为五种土著语言(Quechua、Guarani、Bribri、Kotiria 和 Wa'ikhana)提供了可靠的自动语音识别(ASR)模型,其中包括 Wav2vec2.0 XLS-R 模型的不同变体
该研究介绍了针对南美洲土著语言Quechua的ASR语料库,并评估了自监督学习模型在Quechua语和其他6种土著语言上的效果,结果表明自监督学习模型表现出了惊人的性能。
完成下面两步后,将自动完成登录并继续当前操作。