三维重建房间的新颖视角声学合成
原文中文,约500字,阅读约需2分钟。发表于: 。探究结合盲音频录音和 3D 场景信息对新视角声学合成的益处。通过 2-4 个麦克风的音频录音和包含多个未知声源的场景的 3D 几何学和材料,估计场景中的任何声音。我们确定了新视角声学合成的主要挑战,即声源定位、分离和去混响。虽然简单地训练端到端网络不能产生高质量的结果,但我们证明了融入从 3D...
该研究探究了结合盲音频录音和3D场景信息对新视角声学合成的益处。研究确定了新视角声学合成的主要挑战,并证明了融入从3D重建房间导出的房间脉冲响应(RIRs)使得相同的网络能够统一解决这些任务。在Matterport3D-NVAS数据集上的模拟研究中,该方法优于现有方法,证明了其在利用3D视觉信息方面的有效性。