基于检索增强预训练的神经声学场数据增强

📝

内容提要

本研究解决了房间脉冲响应(RIR)估计的难题,通过对外部大规模数据集进行神经声学场的预训练,提出了一种新的适应方法。主要发现是,可以利用房间几何信息或从外部数据集中检索的几何信息来提高RIR预测的准确性,从而有效改善说话者距离估计的性能。

➡️

继续阅读