本文通过构建RDVS数据集和引入DCTNet+,在RGB-D视频中实现了显著的目标检测。采用多模态注意力模块增强特征,DCTNet+在多种模型中表现优越。同时,提出了深度敏感的RGB特征建模方案和自动架构搜索方法,提升了检测效果,并探讨了未来研究方向。
完成下面两步后,将自动完成登录并继续当前操作。