该研究介绍了一种名为BatVision的低成本机器视觉系统,模仿蝙蝠的回声定位,能够在低光环境中实现物体的三维感知。通过深度学习和多模式融合技术,显著提升了深度估计的准确性和鲁棒性。同时,研究开发了新数据集Real Acoustic Fields,提供真实声场数据,支持音频-视觉神经声学场建模。
完成下面两步后,将自动完成登录并继续当前操作。