SonicSim: 一种可定制的移动声源环境下语音处理的仿真平台
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
我们推出了Real Acoustic Fields(RAF)数据集,包含真实声场数据、多视图图像配对的房间脉冲响应数据,以及声音发射器和听者的6DoF姿态跟踪数据。该数据集用于评估和增强新视角声学合成方法,结合视觉数据与神经声学场模型,展示了模拟-真实方法的有效性。RAF是音频和音频-视觉神经声学研究的理想资源。
🎯
关键要点
- 推出了Real Acoustic Fields(RAF)数据集,包含真实声场数据和多视图图像配对的房间脉冲响应数据。
- 数据集还包括声音发射器和听者的6DoF姿态跟踪数据。
- 用于评估和增强新视角声学合成方法,结合视觉数据与神经声学场模型。
- 展示了模拟-真实方法的有效性,通过模拟数据预训练和稀疏真实数据微调改善少样本学习。
- RAF是第一个提供密集捕获房间声学数据的数据集,是音频和音频-视觉神经声学研究的理想资源。
➡️