LeBenchmark 2.0:一种用于法语语音的标准化、可复制和增强的自监督表示框架

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

LeBenchmark 2.0是一个开源框架,用于评估和构建搭载自监督学习的法语语音技术。该框架包括大量语料库和预训练的SSL wav2vec 2.0模型,以及六个下游任务的评估协议。此外,该论文还讨论了大规模模型训练的碳足迹。

🎯

关键要点

  • LeBenchmark 2.0是一个开源框架,用于评估和构建搭载自监督学习的法语语音技术。

  • 框架包括大量不同类型的语料库,包含长达14,000小时的异构语音数据。

  • 提供十个预训练的SSL wav2vec 2.0模型,学习参数介于2600万到10亿之间。

  • 提供六个下游任务的评估协议,以补充现有基准。

  • 对预训练SSL模型提供独特视角,包括冻结与微调的下游模型。

  • 讨论大规模模型训练的碳足迹。

🏷️

标签

➡️

继续阅读