Bark – 高度逼真的开源、生成式文字转语音模型

原文约500字,阅读约需1分钟。发表于:

Bark 是一款高度逼真的开源、生成式文字转语音模型。它可以生成类似真人的多语言语音,还能生成音乐、背景噪音等简单的音效,以及可以根据文字内容产生笑、叹息和哭泣、喘息声、清嗓子等声音。英语效果优秀,中

Bark是一款开源的生成式文字转语音模型,支持多语言语音、音乐、背景噪音等音效,英语效果优秀,中文效果一般。Bark使用MIT许可证,支持商用,可通过下载或官方排队体验。该模型不同于传统的TTS模型,可以根据文字描述生成意想不到的内容。

Bark – 高度逼真的开源、生成式文字转语音模型
相关推荐 去reddit讨论