小红花·文摘 - 小红花技术领袖俱乐部

17.3K Star！微软开源VibeVoice，AI语音合成新突破，支持90分钟多人对话和实时流式TTS

17.3K Star！微软开源VibeVoice，AI语音合成新突破，支持90分钟多人对话和实时流式TTS

dotNET跨平台 ·

「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！

「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！

机器之心 ·

本文介绍了一种新型音频-视觉语音增强框架，利用个性化模型和神经编解码器从嘈杂信号中合成清晰语音。该框架通过深度学习和视觉信息提高语音质量，适用于多人对话和嘈杂环境，实验结果显示其在语音增强和噪音降低方面表现优异。

实时低信噪比音频视觉语音增强

BriefGPT - AI 论文速递 ·

迅捷布谷鸟一站式专业智能配音工具软件推荐

迅捷布谷鸟一站式专业智能配音工具软件推荐

老董日志 ·