开源服务指南 ·

实时语音克隆，准确复制音色：OpenVoice | 开源日报 No.150

💡 原文中文，约1600字，阅读约需4分钟。

📝

内容提要

OpenVoice 是一个开源项目，通过 MyShell 实现即时语音克隆，能够精确复制音色并生成多种语言和口音的语音。它支持对声音风格进行细粒度控制，包括情感和节奏等参数，并且可以进行零样本跨领域声纹克隆。

🎯

关键要点

OpenVoice 是一个开源项目，通过 MyShell 实现即时语音克隆。
它能够精确克隆参考音色，并生成多种语言和口音的语音。
OpenVoice 允许对声音风格进行细粒度控制，包括情感、口音、节奏、停顿和抑扬等参数。
支持零样本跨领域声纹克隆，无需大规模说话者多语言训练数据集。

❓

延伸问答

OpenVoice 是什么？

OpenVoice 是一个开源项目，通过 MyShell 实现即时语音克隆，能够精确复制音色。

OpenVoice 支持哪些语言和口音的语音生成？

OpenVoice 能够生成多种语言和口音的语音。

如何控制 OpenVoice 中的声音风格？

OpenVoice 允许对声音风格进行细粒度控制，包括情感、口音、节奏、停顿和抑扬等参数。

什么是零样本跨领域声纹克隆？

零样本跨领域声纹克隆是指无需大规模说话者多语言训练数据集即可实现的声纹克隆技术。

OpenVoice 的主要优势是什么？

OpenVoice 的主要优势在于其能够精确克隆音色并支持多种语言和口音的生成，同时允许细粒度的声音风格控制。

OpenVoice 的开发环境是什么？

OpenVoice 是通过 MyShell 开发的，属于开源项目。

🏷️

标签

OpenVoice 声纹克隆多语言开源语音克隆音色复制

➡️

继续阅读

AI 时代的真正竞争力：一个语音按钮与一套可进化的 Harness
XMOS推出搭载先进AI语音处理的VocalFusion XVF3620
XMOS 发布了新一代语音处理器 VocalFusion XVF3620，它将 AI 降噪技术与完整的片上语音处理流程相结合，即使在嘈杂、混响和动态环境中...
开源媒体服务器Jellyfin创始领导层集体辞职项目后续治理和开发路线变得灰暗
#软件资讯开源媒体服务器项目 Jellyfin 创始团队接连离开，项目后续治理和路线变得灰暗，暂时也没有继任安排。近期 Jellyfin 两名联合创始人...
Twitter之父再出手：Block开源Buzz，要让人类和AI Agent「同工同权」
Block（原Square）7月22日开源发布协作平台Buzz——一个基于Nostr协议、让人类员工与AI Agent在同一工作区内以「同等身份」协同工作...
Q2 2026 earnings call: Remarks from our CEO
Read an edited transcript of Sundar Pichai’s remarks from the Q2 2026 Alphabe...
Tesla’s revenues are bouncing back, but profits are still weak
After a dismal two years of weakening demand, falling sales, and damage to it...