弱监督和半监督的三维语义分割的二维特征蒸馏
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
研究人员提出了一种基于图像引导网络(IGNet)的方法,通过使用RGB图像提供场景的更密集表示。IGNet借鉴了2D语义分割网络中的高级特征信息,并利用FOVMix策略解决传感器之间的水平视场不匹配问题。在ScribbleKITTI上实现了弱监督LiDAR语义分割的最先进结果,无需额外的标注负担或推理中的计算/内存成本。IGNet在半监督训练中也展示了有效性,在ScribbleKITTI和SemanticKITTI上均取得了最先进的结果。
🎯
关键要点
-
研究人员提出了一种基于图像引导网络(IGNet)的方法。
-
IGNet通过使用RGB图像提供场景的更密集表示。
-
该方法借鉴了2D语义分割网络中的高级特征信息。
-
利用FOVMix策略解决传感器之间的水平视场不匹配问题。
-
在ScribbleKITTI上实现了弱监督LiDAR语义分割的最先进结果。
-
仅使用8%的标记点,无需额外的标注负担或推理中的计算/内存成本。
-
IGNet在半监督训练中也展示了有效性。
-
在ScribbleKITTI和SemanticKITTI上均取得了最先进的结果。
➡️