小红花·文摘

本文通过构建RDVS数据集和引入DCTNet+，在RGB-D视频中实现了显著的目标检测。采用多模态注意力模块增强特征，DCTNet+在多种模型中表现优越。同时，提出了深度敏感的RGB特征建模方案和自动架构搜索方法，提升了检测效果，并探讨了未来研究方向。