💡
原文中文,约3900字,阅读约需10分钟。
📝
内容提要
阿里通义实验室开源了CosyVoice语音模型,支持自然语音生成,多语言、音色和情感控制。模型训练数据超过15万小时,支持中英日粤韩5种语言合成。提供了Windows和Mac平台的本地部署教程。推荐使用webui进行操作。
🎯
关键要点
- 阿里通义实验室开源了CosyVoice语音模型,支持自然语音生成和多语言合成。
- CosyVoice模型训练数据超过15万小时,支持中英日粤韩5种语言合成。
- 模型支持one-shot音色克隆,仅需3~10秒的原始音频即可生成模拟音色。
- Windows和Mac平台提供本地部署教程,推荐使用webui进行操作。
- Windows平台的安装步骤包括克隆项目、安装依赖和下载模型。
- MacOS平台的安装步骤类似,需通过Homebrew安装sox。
- CosyVoice模型的质量代表了国内AI的最高水准,期待未来的工程化代码开源。
➡️