本文提出了一种新颖的实例分割方法,通过图像级别的类标签生成伪标签,训练完全监督模型。利用 IRNet 从图像分类模型的注意力图中识别种子区域,准确估计实例边界。该方法在 PASCAL VOC 2012 数据集上表现优异,超越了以往的先进模型。
本文介绍了一种新的弱监督语义分割方法,通过敌对擦除逐步挖掘目标区域,最终实现密集的语义分割。在PASCAL VOC 2012数据集上,该方法取得了55.0%和55.7%的平均交集联合度(mIoU)分数,成为新的最优方法。
本文提出了一种基于自注视网络和显著性先验的半监督语义分割模型,能够在PASCAL VOC 2012数据集上超越现有方法。通过多任务学习框架和自适应区域划分,模型有效处理不确定性区域,提升了分割精度,推动了弱监督语义分割的发展。
本文提出了一种基于残差网络的高性能语义图像分割方法,并对不同变体的完全卷积残差网络进行了评估。通过低分辨率网络模拟高分辨率网络、在线启动方法和传统退化法的应用,取得了在 PASCAL VOC 2012 数据集和 Cityscapes 上最好的性能表现。
SegCLIP是基于CLIP的模型,实现了开放式词汇语义分割,通过训练文本-图像对形成语义区域。模型在PASCAL VOC 2012、PASCAL Context和COCO上实现了高精度分割。
本文提出了一种名为LOST的简单方法,用于在图像集合中定位目标,无需昂贵的注释活动。该方法利用自我监督方式预训练的视觉转换器的激活特征,实验结果表明,该方法在PASCAL VOC 2012上的表现优于最先进的目标发现方法,最高可达8 CorLoc点。通过训练一个不具有类别属性的检测器,可以再次提高7个点。在无监督对象发现任务上也展示了有希望的结果。
完成下面两步后,将自动完成登录并继续当前操作。