RoadFormer:RGB-Normal 语义道路场景解析的双工变换器
RoadFormer 是一种基于 Transformer 的数据融合网络,可以精确预测道路场景解析中的语义内容。
DFormer是一种创新的RGB-D预训练框架,使用一系列RGB-D块进行编码,避免了现有方法中RGB预训练的主干网络对深度图中的三维几何关系进行不匹配的编码问题。使用轻量级的解码器头微调预训练的DFormer,在两个RGB-D分割数据集和五个RGB-D显着性数据集上实现了最新的最佳性能,代价为当前最佳方法的一半。