Speech Wikimedia:一个包含 77 种语言的多语言语音数据集
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
介绍了一个新的多说话人英语数据集,用于训练文本转语音模型。该数据集基于公共领域的LibriVox有声读物和Project Gutenberg文本书籍,包含10个说话者的约292小时的语音样本。数据集已公开发布。
🎯
关键要点
-
介绍了一个新的多说话人英语数据集,用于训练文本转语音模型。
-
该数据集基于公共领域的LibriVox有声读物和Project Gutenberg文本书籍。
-
新数据集包含10个说话者的约292小时的语音样本,采样率为44.1 kHz。
-
每个说话者至少有17小时的语音样本。
-
选择高质量语音样本的标准包括至少13 kHz的信号带宽和至少32 dB的信噪比(SNR)。
-
该数据集已公开发布。
➡️