Dia2 - 开源流式对话文本转语音(TTS)模型及推理实现

Dia2 - 开源流式对话文本转语音(TTS)模型及推理实现

云原生 云原生 ·

Dia2是Nari Labs开发的开源文本转语音模型,专注于流式对话音频,支持在接收初始输入后生成音频,并保持说话者一致性。提供1B和2B模型检查点及快速启动指南,适用于实时语音助手和对话系统。

原文英文,约200词,阅读约需1分钟。
阅读原文