SGFormer:用于 360 深度估计的球面几何变换器
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
该研究使用变形补丁嵌入和变形MLP结合传输学习方法,将针孔相机图像和360度环视视觉的语义注释结合起来,实现全景图像的稳健分割。该方法在Stanford2D3D数据集中,不需要超过1400个标记化全景图像的情况下,保持了可比的性能。在室外DensePASS数据集中,该方法使mIoU提高了14.39%,达到了56.38%的新标准。
🎯
关键要点
-
研究使用变形补丁嵌入和变形MLP结合传输学习方法。
-
将针孔相机图像和360度环视视觉的语义注释结合,实现全景图像的稳健分割。
-
在Stanford2D3D数据集中,方法在不超过1400个标记化全景图像的情况下保持可比性能。
-
在室外DensePASS数据集中,mIoU提高了14.39%,达到了56.38%的新标准。
🏷️
标签
➡️