LeBenchmark 对法语句法的学习
原文中文,约300字,阅读约需1分钟。
📝
内容提要
该论文介绍了LeBenchmark 2.0,一个用于评估和构建搭载自监督学习的法语语音技术的开源框架。框架包括语料库、预训练的SSL wav2vec 2.0模型和六个下游任务的评估协议。还讨论了语音预训练模型的不同视角和大规模模型训练的碳足迹。
🎯
关键要点
-
LeBenchmark 2.0 是一个用于评估和构建法语语音技术的开源框架。
-
框架包含长达 14,000 小时的异构语音数据和十个预训练的 SSL wav2vec 2.0 模型。
-
可学习参数数量介于 2600 万到 10 亿之间。
-
提供六个下游任务的评估协议以补充现有基准。
-
对语音预训练 SSL 模型提供了独特视角,包括冻结与微调的下游模型。
-
讨论了大规模模型训练的碳足迹。
🏷️