wav2pos: 使用遮罩自编码器的声源定位
原文中文,约300字,阅读约需1分钟。发表于: 。本研究解决了分布式临时麦克风阵列的3D声源定位问题。通过将这一问题表述为集合到集合的回归问题并训练多模态遮罩自编码器模型,我们实现了对声源的准确定位,甚至在部分音频录音和麦克风坐标缺失的情况下也表现出强大的灵活性。我们的算法在室内环境中的模拟和真实音乐与语音录音测试中,表现出与传统及其他学习基方法相竞争的性能。
本研究通过训练多模态遮罩自编码器模型,解决了分布式临时麦克风阵列的3D声源定位问题。算法在室内环境中的模拟和真实音乐与语音录音测试中表现出与传统及其他学习基方法相竞争的性能。