小红花·文摘 - 小红花技术领袖俱乐部

SHAC 开源全球首个适用于 Web 和桌面端的交互式空间音频格式

SHAC 开源全球首个适用于 Web 和桌面端的交互式空间音频格式

实时互动网 ·

基于波形域神经网络的Ambisonics超分辨率

基于波形域神经网络的Ambisonics超分辨率

Apple Machine Learning Research ·

苹果公司与罗切斯特大学联合开发生成式空间音频模型，进一步提升沉浸式体验

苹果公司与罗切斯特大学联合开发生成式空间音频模型，进一步提升沉浸式体验

实时互动网 ·

本研究提出了一种统一框架，用于盲目估计Ambisonics录音中的频段声学参数，包括混响时间（T60）、直接与混响比（DRR）和清晰度（C50）。新特征SSCV显著提高了估计精度，FOA-Conv3D网络在估计错误上优于现有方法。

盲估计基于Ambisonics录音的子带声学参数：通过光谱空间协方差特征

BriefGPT - AI 论文速递 ·