基于波形域神经网络的Ambisonics超分辨率
我们开发了一种数据驱动的空间音频解决方案,利用卷积时间域音频神经网络(Conv-TasNet),将第一阶Ambisonics(FOA)输入转换为更高阶的Ambisonics(HOA)输出。评估结果显示,预测的3阶HOA与实际之间的平均位置均方误差为0.6dB,感知质量比传统渲染方法提高了80%。
原文英文,约200词,阅读约需1分钟。
我们开发了一种数据驱动的空间音频解决方案,利用卷积时间域音频神经网络(Conv-TasNet),将第一阶Ambisonics(FOA)输入转换为更高阶的Ambisonics(HOA)输出。评估结果显示,预测的3阶HOA与实际之间的平均位置均方误差为0.6dB,感知质量比传统渲染方法提高了80%。