SSL-TTS:利用自监督嵌入和kNN检索实现零-shot多说话人TTS

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出了一种新的轻量级框架SSL-TTS,通过自监督学习特征和检索方法,实现简单而稳健的多说话人合成,适合低资源领域和语言的多说话人TTS系统开发。

🎯

关键要点

  • 本研究提出了一种新的轻量级框架SSL-TTS。

  • SSL-TTS框架通过自监督学习特征和检索方法实现多说话人合成。

  • 该框架适用于低资源领域和语言的多说话人TTS系统开发。

  • SSL-TTS在训练数据要求低的情况下,仍能达到与最先进模型相媲美的性能。

  • 研究解决了现有零-shot多说话人TTS模型对大量转录语音数据集的依赖问题。

➡️

继续阅读