HyperAI超神经 ·

在线教程丨端侧TTS新SOTA！NeuTTS-Air基于0.5B模型实现3秒音频克隆

💡 原文中文，约1500字，阅读约需4分钟。

📝

内容提要

NeuTTS-Air是一种高效的TTS模型，支持本地运行和即时语音克隆，降低了小型企业和个人开发者的使用门槛。该模型在超真实合成和实时推理方面表现优异，适用于手机和树莓派等设备，满足高质量TTS需求。

🎯

🔎

NeuTTS-Air的推出显著降低了高质量TTS模型的使用门槛，尤其适合小型企业和个人开发者。传统模型对计算资源的高要求和成本使得许多开发者望而却步，而NeuTTS-Air的本地运行特性使得即使在资源有限的设备上也能实现高效的语音合成。

由于NeuTTS-Air支持本地运行，用户可以在不依赖云端服务的情况下进行语音合成，这在隐私敏感的场景中尤为重要。传统的TTS模型往往需要将数据上传至云端，可能导致隐私泄露，而NeuTTS-Air则有效避免了这一风险。

NeuTTS-Air不仅适用于即时语音克隆，还能扩展到嵌入式Agent和风格迁移等新场景。这种灵活性使得开发者可以在多种应用中利用该模型，满足不同的需求，进一步推动了TTS技术的普及和应用。

❓

NeuTTS-Air是一种高效的本地运行TTS模型，支持超逼真语音合成和即时语音克隆，基于0.5B Qwen LLM和NeuCodec音频编解码器，具有优异的少样本学习能力。

用户需在HyperAI官网上传参考音频和文本，输入希望生成的音频文本，点击提交后即可得到克隆音频。

NeuTTS-Air支持在CPU上推理，适合手机和树莓派等设备，降低了小型企业和个人开发者的使用成本和技术门槛。

实验评估显示，NeuTTS-Air在超真实合成和实时推理上达到SOTA水平，表现优异。

NeuTTS-Air的发布正值高效、低延迟、高逼真度TTS需求激增之际，特别是在端侧部署和即时语音克隆领域。

是的，用户需在实名认证后才能使用API功能。

🏷️