LeBenchmark 对法语句法的学习

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

该论文介绍了LeBenchmark 2.0,一个用于评估和构建搭载自监督学习的法语语音技术的开源框架。框架包括语料库、预训练的SSL wav2vec 2.0模型和六个下游任务的评估协议。还讨论了语音预训练模型的不同视角和大规模模型训练的碳足迹。

🎯

关键要点

  • LeBenchmark 2.0 是一个用于评估和构建法语语音技术的开源框架。

  • 框架包含长达 14,000 小时的异构语音数据和十个预训练的 SSL wav2vec 2.0 模型。

  • 可学习参数数量介于 2600 万到 10 亿之间。

  • 提供六个下游任务的评估协议以补充现有基准。

  • 对语音预训练 SSL 模型提供了独特视角,包括冻结与微调的下游模型。

  • 讨论了大规模模型训练的碳足迹。

🏷️

标签

➡️

继续阅读