张洪Heo ·

在Mac上使用CosyVoice教程：人声克隆，跨语种复刻、AITTS文本转语音

💡 原文中文，约1300字，阅读约需4分钟。

📝

内容提要

本文介绍了安装和使用CosyVoice多语言、音色和情感控制模型的步骤。首先下载安装包，然后安装Conda和所需的依赖。接下来安装Homebrew和sox，并设置环境变量。最后通过webui.py启动模型，并使用预设音色进行文本转语音。

🎯

关键要点

下载安装包可以从项目地址或国内下载地址获取。
打开终端并进入解压后的文件夹。
安装Conda并创建虚拟环境：conda create -n cosyvoice python=3.8。
激活虚拟环境：conda activate cosyvoice。
安装Python依赖：pip install -r requirements.txt。
安装Homebrew，如果已安装可跳过，未安装可执行安装命令。
安装sox：brew install sox。
设置环境变量：export PYTHONPATH=third_party/AcademiCodec:third_party/Matcha-TTS。
启动模型：python3 webui.py --port 50000 --model_dir speech_tts/CosyVoice-300M。
如遇到ValueError错误，修改webui.py文件的第170行以允许访问localhost。
访问webui浏览器地址：http://127.0.0.1:50000/。
使用预设音色进行文本转语音，选择音色并生成音频。
可以下载生成的音频文件。
跨语种复刻需确保音频与文本内容一致，且合成文本语言不同。
鸣谢刘悦提供的mac适配项目，Windows安装教程可参阅刘悦博客。

❓

延伸问答

如何在Mac上安装CosyVoice？

首先下载安装包，然后打开终端，进入解压后的文件夹，安装Conda并创建虚拟环境，接着安装Python依赖和Homebrew，最后安装sox并设置环境变量。

如何启动CosyVoice模型？

在终端中执行命令：python3 webui.py --port 50000 --model_dir speech_tts/CosyVoice-300M来启动模型。

遇到ValueError错误时该如何解决？

可以修改webui.py文件的第170行，将demo.launch(server_port=args.port)改为demo.launch(server_port=args.port, share=True)。

如何使用CosyVoice进行文本转语音？

选择预设音色，输入需要合成的文本，然后点击生成音频即可。

跨语种复刻需要注意什么？

确保音频与文本内容一致，且合成文本的语言不同于音频的语言。

CosyVoice的下载地址有哪些？

可以从项目地址或国内下载地址（如蓝奏云）获取下载安装包。

🏷️

标签

mac 教程

➡️

继续阅读

AI语音进入“表演时代”：阿里Qwen-Audio-3.0-TTS登顶全球权威榜单
细粒度标签+ 20 种方言
FlashTTS：面向实时语音对话的低时延流式语音合成 | Interspeech 2026
近年来，基于大语言模型（LLM）的文本转语音技术快速发展，基于大语言模型（LLM）的TTS方案已经在自然度、音色相似度和零样本音色克隆（zero-shot...
如何禁用/限制WordPress REST API？关闭接口方法与教程
在WordPress中，禁用REST API通常涉及到几个不同的方法和策略，具体取决于你想达到的目的。 RES […]
危！GPT-5.6会自动删文件，AI初创老板痛失整台Mac
黎曼动力正式发布Rienmann-1.0
90%博客都在替别人打工：一分钱独立建站硬核教程
99%的网站数据存在别人数据库里，你管这叫独立？独立建站每天只花一分钱，这事儿真有那么难？2026年还要自己写HTML上传服务器，听起来像穿越剧情节，但...
90%博客都在替别人打工：一分钱独立建站硬核教程
99%的网站数据存在别人数据库里，你管这叫独立？独立建站每天只花一分钱，这事儿真有那么难？2026年还要自己写HTML上传服务器，听起来像穿越剧情节，但...