本文介绍了一种新的区域活性学习方法MetaBox+,用于语义图像分割。该方法通过元回归模型训练估计未标注图像中每个预测分割的交集联合(IoU),并提出了一种简单但实用的注释成本估计方法。实验结果表明,MetaBox+相比随机获得的方法减少了注释工作量,并且在只有两个不同网络的情况下,相比于完整数据集训练,可以达到95%的平均交集联合(mIoU)。
本文提出了一种基于残差网络的高性能语义图像分割方法,并对不同变体的完全卷积残差网络进行了评估。通过低分辨率网络模拟高分辨率网络、在线启动方法和传统退化法的应用,取得了在 PASCAL VOC 2012 数据集和 Cityscapes 上最好的性能表现。
LSeg是一种新的语言驱动的语义图像分割模型,使用文本编码器和基于transformer的图像编码器计算输入标签和图像的嵌入。LSeg具有高度竞争的零-shot性能,能够对未知类别进行泛化,无需重新训练或仅需要单个样本的训练。
这篇文章总结了二十年来的SiS研究,强调了深度学习方法的最新趋势和DASiS技术的影响。还介绍了与语义图像分割相关的任务和应用,如医学图像分割。
完成下面两步后,将自动完成登录并继续当前操作。