SDformer:高效的端到端变换器用于深度补全
原文中文,约400字,阅读约需1分钟。发表于: 。本研究解决了深度补全任务中传统卷积神经网络(CNN)在表现力有限的问题,提出了一种新的基于窗口的变换器架构SDformer。该方法通过结合深度图和RGB图像特征,并以不同窗口大小提取长距离深度依赖性,显著提升了深度补全的效果,同时降低了计算负载和参数量。SDformer在NYU Depth V2和KITTI DC数据集上表现出色,跨越了CNN表现的限制。
本文介绍了激光雷达深度补全的研究进展,使用LSTM和Transformer模块进行深度估计,并通过门机制和注意力机制实现特征融合。实验证明,该方法在自动驾驶KITTI基准数据集上取得了第一名的成绩。