无监督盲联合消混响和房间声学估计的扩散模型
原文中文,约400字,阅读约需1分钟。发表于: 。本研究解决了单通道盲消混响和房间冲击响应(RIR)估计这一特定问题,提出了一种名为BUDDy的无监督方法。该算法结合了保留混响测量的似然模型和无条件扩散模型实现的无混响语音先验,显著优于其他盲无监督基线,显示了其在不同声学条件下的适应性和卓越性能。
本文研究了结合盲音频录音和3D场景信息对新视角声学合成的益处。通过音频录音和包含多个未知声源的场景的3D几何学和材料,估计场景中的任何声音。通过融入从3D重建房间导出的房间脉冲响应(RIRs),可以统一解决声源定位、分离和去混响等任务。在模拟研究中,该方法在源定位、分离和去混响方面取得了较好的结果。