LeBenchmark 2.0:一种用于法语语音的标准化、可复制和增强的自监督表示框架
原文中文,约400字,阅读约需1分钟。
📝
内容提要
LeBenchmark 2.0是一个开源框架,用于评估和构建搭载自监督学习的法语语音技术。该框架包括大量语料库和预训练的SSL wav2vec 2.0模型,以及六个下游任务的评估协议。此外,该论文还讨论了大规模模型训练的碳足迹。
🎯
关键要点
-
LeBenchmark 2.0是一个开源框架,用于评估和构建搭载自监督学习的法语语音技术。
-
框架包括大量不同类型的语料库,包含长达14,000小时的异构语音数据。
-
提供十个预训练的SSL wav2vec 2.0模型,学习参数介于2600万到10亿之间。
-
提供六个下游任务的评估协议,以补充现有基准。
-
对预训练SSL模型提供独特视角,包括冻结与微调的下游模型。
-
讨论大规模模型训练的碳足迹。
🏷️