LeBenchmark 2.0:一种用于法语语音的标准化、可复制和增强的自监督表示框架
原文中文,约400字,阅读约需1分钟。发表于: 。该论文介绍了 LeBenchmark 2.0,一个用于评估和构建搭载自监督学习的法语语音技术的开源框架,其中包括大量不同类型的语料库,包含长达 14,000 小时的异构语音数据,十个预训练的 SSL wav2vec 2.0 模型,与社区共享的可学习参数介于 2600 万到 10 亿之间,并提供六个下游任务的评估协议以补充现有基准。LeBenchmark 2.0 还对针对语音的预训练 SSL...
LeBenchmark 2.0是一个开源框架,用于评估和构建搭载自监督学习的法语语音技术。该框架包括大量语料库和预训练的SSL wav2vec 2.0模型,以及六个下游任务的评估协议。此外,该论文还讨论了大规模模型训练的碳足迹。