本研究提出了一种深度傅里叶嵌入网络(DFENet),利用快速傅里叶变换解决双模态显著目标检测中的计算复杂度和频率差距问题。DFENet通过模态协调感知注意机制和频率分解边缘感知模块,在四个基准数据集上超越了十二个现有模型。
本研究提出了一种专门为显著目标检测设计的神经网络SODAWideNet++,通过引入注意力引导的长程特征提取模块和大膨胀卷积等技术,有效提高了模型的性能和网络大小。该模型只有35%的可训练参数。
该论文提出了一种基于像素分类的特征学习框架,用于显著目标检测。HyperFusion-Net网络能够自动预测最重要的区域并分割相关物体,在七个公共数据集上表现优于其他现有方法。
该文介绍了一种基于Vision-Transformer的语义蒸馏协助显著目标检测方法,通过融合从生成的图像字幕中语义蒸馏的知识,可以更好地揭示物体之间、物体与环境之间的显著性,并提高了模型性能。在五个基准数据集上的实验表明,该方法优于现有技术。
完成下面两步后,将自动完成登录并继续当前操作。