Spark-TTS是一款基于Qwen2.5模型的文本转语音系统,支持零-shot语音克隆,用户可轻松创建个性化声音。它架构简化、效率提升,支持中英文合成,适用于有声书和虚拟主持人等场景。Mac用户可一键启动,体验自然生动的语音合成。
Spark-TTS是一种基于Qwen2.5大模型的先进文本到语音系统,支持中英文合成和零样本克隆。其特点包括高效流程、可控语音生成和双语支持。使用时需准备环境、安装依赖和下载模型,可通过命令行或Web UI进行合成。常见问题如依赖冲突和克隆效果不佳,已提供解决方案。
完成下面两步后,将自动完成登录并继续当前操作。