SGFormer：用于 360 深度估计的球面几何变换器

本文提出了一种名为 SGFormer 的球面几何转换器，旨在解决 360 深度估计中的全景畸变问题，并通过将球面几何先验引入视觉转换器来增强其性能。在实验中，我们对流行的基准数据集进行了广泛的测试，证明了我们方法优于现有最先进的解决方案。

该研究使用变形补丁嵌入和变形MLP结合传输学习方法，将针孔相机图像和360度环视视觉的语义注释结合起来，实现全景图像的稳健分割。该方法在Stanford2D3D数据集中，不需要超过1400个标记化全景图像的情况下，保持了可比的性能。在室外DensePASS数据集中，该方法使mIoU提高了14.39％，达到了56.38％的新标准。