XTTS 系统基于 Tortoise 模型,支持 16 种语言的语音合成,采用零样本学习和多语言方法,提升低资源语言的合成能力。研究还提出了 AdaSpeech 4 和 ZET-Speech 模型,分别用于高质量语音合成和情感控制,均在多个数据集上表现优异。开源代码旨在支持语言资源有限的社区,推动语音技术创新。
提出了 XTTS 系统,是基于 Tortoise 模型的多语言训练方法,通过改进声纹克隆和加快训练和推理速度,实现了在 16 种语言中取得了最先进的结果。
完成下面两步后,将自动完成登录并继续当前操作。