小众软件 ·

Bark – 高度逼真的开源、生成式文字转语音模型

💡 原文中文，约500字，阅读约需1分钟。

📝

内容提要

Bark是一款开源的生成式文字转语音模型，支持多语言语音、音乐、背景噪音等音效，英语效果优秀，中文效果一般。Bark使用MIT许可证，支持商用，可通过下载或官方排队体验。该模型不同于传统的TTS模型，可以根据文字描述生成意想不到的内容。

🎯

关键要点

Bark是一款开源的生成式文字转语音模型。
支持多语言语音、音乐、背景噪音等音效。
英语效果优秀，中文效果一般。
可以生成笑、叹息、哭泣、喘息声等声音。
支持通过文本生成歌曲。
开源模型，用户可以下载或通过官方排队体验。
使用MIT许可证，允许商用。
经过CPU和GPU测试，兼容pytorch 2.0+，CUDA 11.7和CUDA 12.0。
Bark是完全生成式的文本-音频模型，不同于传统的TTS模型。

🏷️

标签

Bark MIT许可证开源生成式语音模型

➡️

继续阅读

1.5B开源通用VLA模型，冲进具身智能第一梯队
面壁智能发布MiniCPM-Robot系列模型
实测千问 Qwen3.8 预览版，国产模型开始围攻 Fable 5
还有 DeepSeek、智谱、MiniMax……#欢迎关注爱范儿官方微信公众号：爱范儿（微信号：ifanr），更多精彩内容第一时间为您奉上。
Kimi K3上线48小时：模型爆火，GPU爆肝，会员停售
市场表现也跟着加速狂飙
FlashTTS：面向实时语音对话的低时延流式语音合成 | Interspeech 2026
近年来，基于大语言模型（LLM）的文本转语音技术快速发展，基于大语言模型（LLM）的TTS方案已经在自然度、音色相似度和零样本音色克隆（zero-shot...
蚂蚁集团、阿里云等正式加入PyTorch基金会，携手全球开源力量推动AI普惠
拼装取代生成：这个开源工具用115个原子元件终结AI低效编码
115个软件元素一次拼装就够，为什么还要让大模型每次从零生成代码？一个叫Software Periodic Table的开源项目把常用软件模块像化学元素...