SSL-TTS:利用自监督嵌入和kNN检索实现零-shot多说话人TTS
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本研究提出了一种新的轻量级框架SSL-TTS,通过自监督学习特征和检索方法,实现简单而稳健的多说话人合成,适合低资源领域和语言的多说话人TTS系统开发。
🎯
关键要点
- 本研究提出了一种新的轻量级框架SSL-TTS。
- SSL-TTS框架通过自监督学习特征和检索方法实现多说话人合成。
- 该框架适用于低资源领域和语言的多说话人TTS系统开发。
- SSL-TTS在训练数据要求低的情况下,仍能达到与最先进模型相媲美的性能。
- 研究解决了现有零-shot多说话人TTS模型对大量转录语音数据集的依赖问题。
➡️