小红花·文摘 - 小红花技术领袖俱乐部

VibeVoice开源语音生成模型解析：因太强被紧急下架，加水印后免费开源

VibeVoice开源语音生成模型解析：因太强被紧急下架，加水印后免费开源

极道 ·

微软发布 VibeVoice-ASR：一种统一的语音转文本模型，旨在一次性处理长达 60 分钟的音频

微软发布 VibeVoice-ASR：一种统一的语音转文本模型，旨在一次性处理长达 60 分钟的音频

实时互动网 ·

17.3K Star！微软开源VibeVoice，AI语音合成新突破，支持90分钟多人对话和实时流式TTS

17.3K Star！微软开源VibeVoice，AI语音合成新突破，支持90分钟多人对话和实时流式TTS

dotNET跨平台 ·

在线教程丨微软开源VibeVoice，可实现90分钟4角色自然对话

在线教程丨微软开源VibeVoice，可实现90分钟4角色自然对话

HyperAI超神经 ·

VibeVoice初学者指南

VibeVoice初学者指南

KDnuggets ·

微软开源的VibeVoice-1.5B模型在TTS领域备受关注，能够生成90分钟的高自然度语音，支持4位说话者。其创新点在于双Tokenizer架构和扩散解码技术，MOS评分达到4.5。该模型主要面向科研和开发者，目前仅支持中英文，强调研究用途以防滥用。

在线教程 | VibeVoice-1.5B独创双Tokenizer架构实现一次性生成90分钟4人对话语音，重新定义TTS技术边界

HyperAI超神经 ·

VibeVoice-1.5B：微软开源文本转语音模型，可合成四个不同说话者长达 90 分钟的语音

VibeVoice-1.5B：微软开源文本转语音模型，可合成四个不同说话者长达 90 分钟的语音

实时互动网 ·