SSL-TTS:利用自监督嵌入和kNN检索实现零-shot多说话人TTS

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本研究提出了一种新的轻量级框架SSL-TTS,通过自监督学习特征和检索方法,实现简单而稳健的多说话人合成,适合低资源领域和语言的多说话人TTS系统开发。

🎯

关键要点

  • 本研究提出了一种新的轻量级框架SSL-TTS。
  • SSL-TTS框架通过自监督学习特征和检索方法实现多说话人合成。
  • 该框架适用于低资源领域和语言的多说话人TTS系统开发。
  • SSL-TTS在训练数据要求低的情况下,仍能达到与最先进模型相媲美的性能。
  • 研究解决了现有零-shot多说话人TTS模型对大量转录语音数据集的依赖问题。
➡️

继续阅读