本文介绍了多种基于Transformer的模型,如DATFormer、PAVER和SGFormer,旨在解决360°数据投影和特征失真问题。这些模型在全景深度估计和物体检测等任务中表现优越,显著提高了精度和性能,研究结果显示其在多个公开数据集上均优于现有技术。
本研究提出了一种基于未标记360度数据的深度估计框架,通过六面立方体投影生成伪标签,显著提高了深度估计的准确性。扩展数据集和辅助监督方法增强了模型的泛化能力,并在多个数据集上验证了其有效性。此外,DATFormer模型有效解决了360度数据投影的特征失真问题,表现优越。
本文介绍了一种基于Fisheye降采样和失真感知Transformer的全景图像高清增强方法,实验结果表明该方法优于传统技术。该方法结合全向图像超分辨率与真实感,采用弱监督学习进行3D深度估计,并提出了新的深度学习框架OmniZoomer,以解决特征失真问题。此外,研究展示了ResVR框架在低传输开销下提供高质量全景图的能力。
完成下面两步后,将自动完成登录并继续当前操作。