基于波形域神经网络的Ambisonics超分辨率

基于波形域神经网络的Ambisonics超分辨率

Apple Machine Learning Research Apple Machine Learning Research ·

我们开发了一种数据驱动的空间音频解决方案,利用卷积时间域音频神经网络(Conv-TasNet),将第一阶Ambisonics(FOA)输入转换为更高阶的Ambisonics(HOA)输出。评估结果显示,预测的3阶HOA与实际之间的平均位置均方误差为0.6dB,感知质量比传统渲染方法提高了80%。

原文英文,约200词,阅读约需1分钟。
阅读原文