GigaSpeech 2是一个为低资源语言设计的大规模、多领域、多语种的语音识别语料库。通过自动化的数据处理流程和修改的Noisy Student Training,提高了模型性能。实验结果显示,基于GigaSpeech 2训练的ASR模型在泰语、印尼语和越南语的测试集上词错误率降低25%至40%。该语料库和流程为低资源语音识别研究提供了新的途径。
GigaSpeech 2是一个为低资源语言设计的大规模、多领域、多语种的语音识别语料库。通过自动化的数据处理流程和修改的Noisy Student Training,提高了模型性能。实验结果显示,基于GigaSpeech 2训练的ASR模型在泰语、印尼语和越南语的测试集上词错误率降低25%至40%。该语料库和流程将为低资源语音识别研究开辟新的途径。
GigaSpeech 2是一个为低资源语言设计的大规模、多领域、多语种的语音识别语料库。通过自动化的数据处理和Noisy Student Training,提高了模型性能。实验结果表明,GigaSpeech 2训练的ASR模型在泰语、印尼语和越南语的测试集上词错误率降低25%至40%。基于GigaSpeech 2训练的ASR模型性能优于商业服务。该研究为低资源语音识别开辟了新的研究途径并促进了该领域的发展。
完成下面两步后,将自动完成登录并继续当前操作。