ChatTTS,语气韵律媲美真人的开源TTS模型,文字转语音界的新魁首,对标微软Azure-tts
原文中文,约3000字,阅读约需8分钟。发表于: 。前两天2noise团队开源了ChatTTS项目,并且释出了相关的音色模型权重,效果确实非常惊艳,让人一听难忘,即使摆在微软的商业级项目Azure-tts面前,也是毫不逊色的。ChatTTS是专门为对话场景设计的文本转语音模型,例如大语言助手对话任务。它支持英文和中文两种语言。最大的模型使用了10万小时以上的中英文数据进行训练。目前在huggingface中的开源版本为4万小时训练且未SFT的...
2noise团队开源了ChatTTS项目,提供音色模型权重,支持英文和中文。文章介绍了本地部署ChatTTS项目的配置和基本使用方法,同时提供了进阶用法和中文样例。ChatTTS模型稳定性有待提高,但整体效果令人惊艳。