💡
原文中文,约1300字,阅读约需4分钟。
📝
内容提要
本文介绍了安装和使用CosyVoice多语言、音色和情感控制模型的步骤。首先下载安装包,然后安装Conda和所需的依赖。接下来安装Homebrew和sox,并设置环境变量。最后通过webui.py启动模型,并使用预设音色进行文本转语音。
🎯
关键要点
- 下载安装包可以从项目地址或国内下载地址获取。
- 打开终端并进入解压后的文件夹。
- 安装Conda并创建虚拟环境:conda create -n cosyvoice python=3.8。
- 激活虚拟环境:conda activate cosyvoice。
- 安装Python依赖:pip install -r requirements.txt。
- 安装Homebrew,如果已安装可跳过,未安装可执行安装命令。
- 安装sox:brew install sox。
- 设置环境变量:export PYTHONPATH=third_party/AcademiCodec:third_party/Matcha-TTS。
- 启动模型:python3 webui.py --port 50000 --model_dir speech_tts/CosyVoice-300M。
- 如遇到ValueError错误,修改webui.py文件的第170行以允许访问localhost。
- 访问webui浏览器地址:http://127.0.0.1:50000/。
- 使用预设音色进行文本转语音,选择音色并生成音频。
- 可以下载生成的音频文件。
- 跨语种复刻需确保音频与文本内容一致,且合成文本语言不同。
- 鸣谢刘悦提供的mac适配项目,Windows安装教程可参阅刘悦博客。
❓
延伸问答
如何在Mac上安装CosyVoice?
首先下载安装包,然后打开终端,进入解压后的文件夹,安装Conda并创建虚拟环境,接着安装Python依赖和Homebrew,最后安装sox并设置环境变量。
如何启动CosyVoice模型?
在终端中执行命令:python3 webui.py --port 50000 --model_dir speech_tts/CosyVoice-300M来启动模型。
遇到ValueError错误时该如何解决?
可以修改webui.py文件的第170行,将demo.launch(server_port=args.port)改为demo.launch(server_port=args.port, share=True)。
如何使用CosyVoice进行文本转语音?
选择预设音色,输入需要合成的文本,然后点击生成音频即可。
跨语种复刻需要注意什么?
确保音频与文本内容一致,且合成文本的语言不同于音频的语言。
CosyVoice的下载地址有哪些?
可以从项目地址或国内下载地址(如蓝奏云)获取下载安装包。
➡️