本文介绍了一种名为互动上下文感知网络(ICANet)的新型网络,旨在提高RGB-T目标检测的准确性。通过多模态特征融合和跨尺度融合技术,提出了多种视觉关注机制,验证了其在不同数据集上的有效性,推动了RGB-T视频目标检测的研究进展。
完成下面两步后,将自动完成登录并继续当前操作。