在Mac上使用CosyVoice教程:人声克隆,跨语种复刻、AITTS文本转语音

在Mac上使用CosyVoice教程:人声克隆,跨语种复刻、AITTS文本转语音

💡 原文中文,约1300字,阅读约需4分钟。
📝

内容提要

本文介绍了安装和使用CosyVoice多语言、音色和情感控制模型的步骤。首先下载安装包,然后安装Conda和所需的依赖。接下来安装Homebrew和sox,并设置环境变量。最后通过webui.py启动模型,并使用预设音色进行文本转语音。

🎯

关键要点

  • 下载安装包可以从项目地址或国内下载地址获取。
  • 打开终端并进入解压后的文件夹。
  • 安装Conda并创建虚拟环境:conda create -n cosyvoice python=3.8。
  • 激活虚拟环境:conda activate cosyvoice。
  • 安装Python依赖:pip install -r requirements.txt。
  • 安装Homebrew,如果已安装可跳过,未安装可执行安装命令。
  • 安装sox:brew install sox。
  • 设置环境变量:export PYTHONPATH=third_party/AcademiCodec:third_party/Matcha-TTS。
  • 启动模型:python3 webui.py --port 50000 --model_dir speech_tts/CosyVoice-300M。
  • 如遇到ValueError错误,修改webui.py文件的第170行以允许访问localhost。
  • 访问webui浏览器地址:http://127.0.0.1:50000/。
  • 使用预设音色进行文本转语音,选择音色并生成音频。
  • 可以下载生成的音频文件。
  • 跨语种复刻需确保音频与文本内容一致,且合成文本语言不同。
  • 鸣谢刘悦提供的mac适配项目,Windows安装教程可参阅刘悦博客。

延伸问答

如何在Mac上安装CosyVoice?

首先下载安装包,然后打开终端,进入解压后的文件夹,安装Conda并创建虚拟环境,接着安装Python依赖和Homebrew,最后安装sox并设置环境变量。

如何启动CosyVoice模型?

在终端中执行命令:python3 webui.py --port 50000 --model_dir speech_tts/CosyVoice-300M来启动模型。

遇到ValueError错误时该如何解决?

可以修改webui.py文件的第170行,将demo.launch(server_port=args.port)改为demo.launch(server_port=args.port, share=True)。

如何使用CosyVoice进行文本转语音?

选择预设音色,输入需要合成的文本,然后点击生成音频即可。

跨语种复刻需要注意什么?

确保音频与文本内容一致,且合成文本的语言不同于音频的语言。

CosyVoice的下载地址有哪些?

可以从项目地址或国内下载地址(如蓝奏云)获取下载安装包。

🏷️

标签

➡️

继续阅读