RoadFormer:RGB-Normal 语义道路场景解析的双工变换器
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
DFormer是一种创新的RGB-D预训练框架,使用一系列RGB-D块进行编码,避免了现有方法中RGB预训练的主干网络对深度图中的三维几何关系进行不匹配的编码问题。使用轻量级的解码器头微调预训练的DFormer,在两个RGB-D分割数据集和五个RGB-D显着性数据集上实现了最新的最佳性能,代价为当前最佳方法的一半。
🎯
关键要点
- DFormer是一种创新的RGB-D预训练框架。
- DFormer通过使用RGB-D块进行编码,将RGB和深度信息编码成可转移的表示。
- DFormer避免了现有方法中RGB预训练主干网络对深度图三维几何关系的不匹配编码问题。
- 使用轻量级解码器头微调预训练的DFormer。
- DFormer在两个RGB-D分割数据集和五个RGB-D显着性数据集上实现了最新的最佳性能。
- DFormer的计算成本仅为当前最佳方法的一半。
➡️