百灵 TTS:面向人类化自然表达的汉语方言语音合成
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
该论文研究了英文到台湾闽南语的语音翻译,包括数据收集、建模和发布基准数据集。通过人工注释、数据自动挖掘和伪标注方法,收集了大量数据。在模型训练中,结合自监督离散表示和普通话文本监督,取得了良好效果。最后,推出了一个S2ST基准数据集。
🎯
关键要点
- 该论文研究了英文到台湾闽南语的语音翻译。
- 研究内容包括数据收集、建模和基准数据集的发布。
- 通过人工注释、数据自动挖掘和伪标注方法,收集了大量数据。
- 模型训练结合自监督离散表示和普通话文本监督,取得了良好效果。
- 推出了一个S2ST基准数据集,以助于未来的研究。
➡️