ProsodyFM: Unsupervised Phrase and Pitch Control for Enhanced Understandability in Speech Synthesis
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了一种新颖的ProsodyFM模型,旨在改善语音合成在短语和音调方面的不足。该模型通过短语断点和终端音调编码器,提高了语音的可懂性和对复杂句子的适应能力。
🎯
关键要点
- 本研究提出了一种新颖的ProsodyFM模型,旨在改善语音合成在短语和音调方面的不足。
- ProsodyFM模型通过引入短语断点编码器和终端音调编码器,提升了语音的可懂性。
- 该模型能够在没有显式音韵标签的情况下,揭示多种断点时长和音调模式。
- ProsodyFM模型显著提高了对复杂句子及说话者的适应能力。
➡️