AsymFormer是一种用于实时RGB-D语义分割的新型网络,通过优化计算资源分配和引入非对称骨干网络,实现了多模态特征的有效融合。通过重新定义特征选择和提取多模态自相似特征,同时不增加参数数量,以确保在机器人平台上实时执行。在NYUv2和SUNRGBD数据集上评估,AsymFormer在准确度和效率方面取得了平衡。
本文介绍了一种新型网络AsymFormer,用于实时RGB-D语义分割。通过优化计算资源分配和引入非对称骨干网络,实现多模态特征的有效融合。使用局部关注引导特征选择(LAFS)模块,选择性地融合特征。在NYUv2和SUNRGBD数据集上评估,AsymFormer在准确度和效率方面取得了平衡。
本文提出了一种名为AsymFormer的新型网络,用于实现实时RGB-D语义分割。该网络通过优化计算资源分配和引入非对称骨干网络,对冗余参数进行了最小化,以实现多模态特征的有效融合。在NYUv2和SUNRGBD数据集上评估该方法,AsymFormer在NYUv2上实现了52.0%的mIoU,在SUNRGBD上实现了49.1%的mIoU。在RTX3090上实现了65 FPS的推理速度,在实施混合精度量化后,达到了令人印象深刻的79 FPS的推理速度。
完成下面两步后,将自动完成登录并继续当前操作。