本文研究了在全稀疏架构中如何有效利用图像模态,并通过实例查询将2D和3D实例分割部分集成到LiDAR侧,实现了统一的基于查询的2D和3D融合框架。实验证明了该方法在nuScenes和Argoverse 2数据集上具有最先进的性能,并且在长距离LiDAR感知设置下的推理速度比其他多模式3D检测方法快2.7倍。
完成下面两步后,将自动完成登录并继续当前操作。