小红花·文摘 - 小红花技术领袖俱乐部

OpenMOSS发布MOSS-Audio：一个用于语音、声音、音乐和时间感知音频推理的开源基础模型

OpenMOSS发布MOSS-Audio：一个用于语音、声音、音乐和时间感知音频推理的开源基础模型

实时互动网 ·

本文介绍了一种名为SoundVista的新方法，通过视觉-声学绑定从新视角合成环境声音。该方法不依赖声源细节的先验知识，适应不同房间布局和麦克风配置，在多种环境中表现出显著改进。

SoundVista: Novel-View Ambient Sound Synthesis via Visual-Acoustic Binding

BriefGPT - AI 论文速递 ·