RoadFormer+: 通过尺度感知信息解耦和先进的异构特征融合实现 RGB-X 场景解析

💡 原文中文,约500字,阅读约需2分钟。
📝

内容提要

AsymFormer是一种用于实时RGB-D语义分割的新型网络,通过优化计算资源分配和引入非对称骨干网络,实现了多模态特征的有效融合。通过重新定义特征选择和提取多模态自相似特征,同时不增加参数数量,以确保在机器人平台上实时执行。在NYUv2和SUNRGBD数据集上评估,AsymFormer在准确度和效率方面取得了平衡。

🎯

关键要点

  • AsymFormer是一种用于实时RGB-D语义分割的新型网络。
  • 通过优化计算资源分配和引入非对称骨干网络,最小化冗余参数,实现多模态特征的有效融合。
  • 重新定义特征选择和提取多模态自相似特征,确保在机器人平台上实时执行。
  • 使用局部关注引导特征选择(LAFS)模块,选择性地融合特征。
  • 在NYUv2数据集上实现52.0%的mIoU,在SUNRGBD数据集上实现49.1%的mIoU。
  • 在RTX3090上实现65 FPS的推理速度,经过混合精度量化后达到79 FPS。
  • AsymFormer在RGB-D语义分割中实现高准确度和高效性之间的平衡。
➡️

继续阅读