Towards Controllable Speech Synthesis in the Era of Large Language Models: A Survey

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究综述了文本到语音合成(TTS)领域中可控语音生成的现状,提出了系统方法并分类了控制技术。同时首次汇总了相关数据集和评估指标,展示了可控TTS的未来发展潜力。

🎯

关键要点

  • 本研究综述了文本到语音合成(TTS)领域中可控语音生成的现状。
  • 提出了一种系统的方法,涵盖了基础控制技术和利用自然语言提示的方法。
  • 对可控语音合成进行了清晰的分类和理解。
  • 首次汇总了相关数据集和评估指标。
  • 展示了可控TTS的未来发展潜力。
➡️

继续阅读