小红花·文摘

XTTS 系统基于 Tortoise 模型，支持 16 种语言的语音合成，采用零样本学习和多语言方法，提升低资源语言的合成能力。研究还提出了 AdaSpeech 4 和 ZET-Speech 模型，分别用于高质量语音合成和情感控制，均在多个数据集上表现优异。开源代码旨在支持语言资源有限的社区，推动语音技术创新。

面向阿拉伯方言的零射 Text-To-Speech

BriefGPT - AI 论文速递 ·

提出了 XTTS 系统，是基于 Tortoise 模型的多语言训练方法，通过改进声纹克隆和加快训练和推理速度，实现了在 16 种语言中取得了最先进的结果。

XTTS：一种大规模多语言零射击文本转语音模型

BriefGPT - AI 论文速递 ·