CSFNet: 用于驾驶场景实时 RGB-X 语义分割的余弦相似度融合网络
原文中文,约300字,阅读约需1分钟。发表于: 。本研究提出了余弦相似度融合网络 (CSFNet) 作为实时的 RGB-X 语义分割模型,通过设计余弦相似度注意力融合模块 (CS-AFM) 在不同模态之间有效地整合和融合特征,提高了交叉模态特征在低层的融合,使得高层可以采用单支路网络,从而实现更快速和准确的预测,并在 RGB-D/T/P 语义分割任务中验证了其效果和高效性。
CPGNet-LCF是一个新的多模态融合框架,通过引入弱校准知识蒸馏策略解决了LiDAR和相机之间的挑战。它在nuScenes和SemanticKITTI基准测试上取得了最先进的性能,以20ms每帧的速度在单个Tesla V100 GPU上运行。