上下文感知交互网络用于 RGB-T 语义分割
原文中文,约500字,阅读约需2分钟。发表于: 。RGB-T 语义分割技术在自动驾驶场景理解中起着关键作用。本研究提出了一种用于 RGB-T 语义分割的上下文感知交互网络(CAINet),通过建立交互空间来利用辅助任务和全局上下文进行显式引导学习。通过引入上下文感知的互补推理模块、全局上下文建模模块和细节聚合模块,以及特定辅助监督,对多模态特征之间的互补关系进行建模,进一步提高分割效果。对 MFNet 和 PST900...
该文章介绍了使用Criss-Cross网络获取图像上下文信息的方法,重点介绍了Criss-Cross attention模块的优点和性能。经过广泛实验,CCNet在多个基准测试中取得了最先进的结果,尤其在Cityscapes测试集上获得了81.9%的mIoU分数。