Towards Controllable Speech Synthesis in the Era of Large Language Models: A Survey
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究综述了文本到语音合成(TTS)领域中可控语音生成的现状,提出了系统方法并分类了控制技术。同时首次汇总了相关数据集和评估指标,展示了可控TTS的未来发展潜力。
🎯
关键要点
- 本研究综述了文本到语音合成(TTS)领域中可控语音生成的现状。
- 提出了一种系统的方法,涵盖了基础控制技术和利用自然语言提示的方法。
- 对可控语音合成进行了清晰的分类和理解。
- 首次汇总了相关数据集和评估指标。
- 展示了可控TTS的未来发展潜力。
➡️