在Mac上使用CosyVoice教程:人声克隆,跨语种复刻、AITTS文本转语音

在Mac上使用CosyVoice教程:人声克隆,跨语种复刻、AITTS文本转语音

💡 原文中文,约1300字,阅读约需4分钟。
📝

内容提要

本文介绍了安装和使用CosyVoice多语言、音色和情感控制模型的步骤。首先下载安装包,然后安装Conda和所需的依赖。接下来安装Homebrew和sox,并设置环境变量。最后通过webui.py启动模型,并使用预设音色进行文本转语音。

🎯

关键要点

  • 下载安装包可以从项目地址或国内下载地址获取。
  • 打开终端并进入解压后的文件夹。
  • 安装Conda并创建虚拟环境:conda create -n cosyvoice python=3.8。
  • 激活虚拟环境:conda activate cosyvoice。
  • 安装Python依赖:pip install -r requirements.txt。
  • 安装Homebrew,如果已安装可跳过,未安装可执行安装命令。
  • 安装sox:brew install sox。
  • 设置环境变量:export PYTHONPATH=third_party/AcademiCodec:third_party/Matcha-TTS。
  • 启动模型:python3 webui.py --port 50000 --model_dir speech_tts/CosyVoice-300M。
  • 如遇到ValueError错误,修改webui.py文件的第170行以允许访问localhost。
  • 访问webui浏览器地址:http://127.0.0.1:50000/。
  • 使用预设音色进行文本转语音,选择音色并生成音频。
  • 可以下载生成的音频文件。
  • 跨语种复刻需确保音频与文本内容一致,且合成文本语言不同。
  • 鸣谢刘悦提供的mac适配项目,Windows安装教程可参阅刘悦博客。
🏷️

标签

➡️

继续阅读