多声源定位新方法:结合α稳定模型与神经网络的SHAMaNS

声源定位(Sound Source Localization, SSL)作为机器听觉领域的基础任务,在增强听觉、机器人技术、自动驾驶等场景中应用广泛。现有 SSL 技术主要分为声学...

声源定位(SSL)在增强听觉和自动驾驶等领域应用广泛。日本理化学研究所提出的新型混合技术SHAMaNS,结合α稳定模型与神经网络,成功解决了稀疏测量和噪声鲁棒性问题。实验结果显示,SHAMaNS在多声源场景中表现优异,适应能力强,未来计划扩展至三维定位。

多声源定位新方法:结合α稳定模型与神经网络的SHAMaNS
原文中文,约2000字,阅读约需5分钟。发表于:
阅读原文