SGFormer:用于 360 深度估计的球面几何变换器
原文中文,约300字,阅读约需1分钟。发表于: 。本文提出了一种名为 SGFormer 的球面几何转换器,旨在解决 360 深度估计中的全景畸变问题,并通过将球面几何先验引入视觉转换器来增强其性能。在实验中,我们对流行的基准数据集进行了广泛的测试,证明了我们方法优于现有最先进的解决方案。
该研究使用变形补丁嵌入和变形MLP结合传输学习方法,将针孔相机图像和360度环视视觉的语义注释结合起来,实现全景图像的稳健分割。该方法在Stanford2D3D数据集中,不需要超过1400个标记化全景图像的情况下,保持了可比的性能。在室外DensePASS数据集中,该方法使mIoU提高了14.39%,达到了56.38%的新标准。