百灵 TTS:面向人类化自然表达的汉语方言语音合成

💡 原文中文,约1600字,阅读约需4分钟。
📝

内容提要

本文介绍了一种新颖的中文方言TTS前端和翻译模块,旨在将普通话文本转化为方言,以提高语音合成的可懂性和自然度。实验结果表明,该方法在粤语上的性能显著提升。此外,研究还探讨了多说话人语音合成、跨语言语音转移及情感语音合成模型,均取得良好效果。

🎯

关键要点

  • 提出了一种新颖的中文方言TTS前端和翻译模块,将普通话文本转化为方言,提升语音合成的可懂性和自然度。
  • 该方法在粤语上的实验结果显示出2.56 BLEU和0.27 MOS的性能提升。
  • 研究了多说话人语音合成、跨语言语音转移及情感语音合成模型,均取得良好效果。

延伸问答

百灵 TTS 的主要功能是什么?

百灵 TTS 的主要功能是将普通话文本转化为方言,以提高语音合成的可懂性和自然度。

该方法在粤语上的实验结果如何?

在粤语上的实验结果显示出2.56 BLEU和0.27 MOS的性能提升。

百灵 TTS 采用了哪些技术?

百灵 TTS 采用了非自回归神经机器翻译模型和多种技巧。

研究中还探讨了哪些语音合成模型?

研究中探讨了多说话人语音合成、跨语言语音转移及情感语音合成模型。

百灵 TTS 如何提高语音合成的自然度?

通过将普通话文本转化为方言,百灵 TTS 提高了语音合成的自然度。

该研究的创新点是什么?

该研究的创新点在于首次将翻译与 TTS 前端相结合。

➡️

继续阅读