MSFormer:一种用于牙齿实例分割的骨架多视角融合方法
💡
原文中文,约500字,阅读约需2分钟。
📝
内容提要
AsymFormer是一种新型网络,用于实时RGB-D语义分割。该网络通过优化计算资源分配和引入非对称骨干网络,最小化冗余参数,以实现多模态特征的有效融合。使用局部关注引导特征选择(LAFS)模块,通过利用不同模态之间的依赖关系选择性地融合特征。在NYUv2和SUNRGBD数据集上评估该方法,AsymFormer在NYUv2上实现了52.0%的mIoU,在SUNRGBD上实现了49.1%的mIoU。在RTX3090上实现65 FPS的推理速度,在实施混合精度量化后,达到了79 FPS的推理速度。
🎯
关键要点
-
AsymFormer是一种新型网络,专注于实时RGB-D语义分割。
-
该网络通过优化计算资源分配和引入非对称骨干网络,最小化冗余参数。
-
AsymFormer实现了多模态特征的有效融合,确保实时执行。
-
使用局部关注引导特征选择(LAFS)模块,选择性地融合不同模态的特征。
-
在NYUv2数据集上,AsymFormer实现了52.0%的mIoU,在SUNRGBD上实现了49.1%的mIoU。
-
在RTX3090上,AsymFormer实现了65 FPS的推理速度,混合精度量化后达到了79 FPS。
-
AsymFormer在RGB-D语义分割中实现了高准确度和高效性之间的平衡。
🏷️
标签
➡️