小红花·文摘

GigaSpeech 2是一个为低资源语言设计的大规模、多领域、多语种的语音识别语料库。通过自动化的数据处理流程和修改的Noisy Student Training，提高了模型性能。实验结果显示，基于GigaSpeech 2训练的ASR模型在泰语、印尼语和越南语的测试集上词错误率降低25%至40%。该语料库和流程为低资源语音识别研究提供了新的途径。

IndicVoices-R：解锁一个巨大的多语言多说话人语音语料库，以扩展印度文本到语音技术

BriefGPT - AI 论文速递 ·

GigaSpeech 2是一个为低资源语言设计的大规模、多领域、多语种的语音识别语料库。通过自动化的数据处理流程和修改的Noisy Student Training，提高了模型性能。实验结果显示，基于GigaSpeech 2训练的ASR模型在泰语、印尼语和越南语的测试集上词错误率降低25%至40%。该语料库和流程将为低资源语音识别研究开辟新的途径。

FLEURS-R：用于生成任务的恢复多语言语音语料库

BriefGPT - AI 论文速递 ·

GigaSpeech 2是一个为低资源语言设计的大规模、多领域、多语种的语音识别语料库。通过自动化的数据处理和Noisy Student Training，提高了模型性能。实验结果表明，GigaSpeech 2训练的ASR模型在泰语、印尼语和越南语的测试集上词错误率降低25%至40%。基于GigaSpeech 2训练的ASR模型性能优于商业服务。该研究为低资源语音识别开辟了新的研究途径并促进了该领域的发展。

MSR-86K：一个包含 86,300 小时语音转换文本的多语种演变语料库，用于语音识别研究

BriefGPT - AI 论文速递 ·