💡
原文中文,约1300字,阅读约需4分钟。
📝
内容提要
本文介绍了安装和使用CosyVoice多语言、音色和情感控制模型的步骤。首先下载安装包,然后安装Conda和所需的依赖。接下来安装Homebrew和sox,并设置环境变量。最后通过webui.py启动模型,并使用预设音色进行文本转语音。
🎯
关键要点
- 下载安装包可以从项目地址或国内下载地址获取。
- 打开终端并进入解压后的文件夹。
- 安装Conda并创建虚拟环境:conda create -n cosyvoice python=3.8。
- 激活虚拟环境:conda activate cosyvoice。
- 安装Python依赖:pip install -r requirements.txt。
- 安装Homebrew,如果已安装可跳过,未安装可执行安装命令。
- 安装sox:brew install sox。
- 设置环境变量:export PYTHONPATH=third_party/AcademiCodec:third_party/Matcha-TTS。
- 启动模型:python3 webui.py --port 50000 --model_dir speech_tts/CosyVoice-300M。
- 如遇到ValueError错误,修改webui.py文件的第170行以允许访问localhost。
- 访问webui浏览器地址:http://127.0.0.1:50000/。
- 使用预设音色进行文本转语音,选择音色并生成音频。
- 可以下载生成的音频文件。
- 跨语种复刻需确保音频与文本内容一致,且合成文本语言不同。
- 鸣谢刘悦提供的mac适配项目,Windows安装教程可参阅刘悦博客。
➡️