驾驶场景的弱监督语义分割
原文中文,约500字,阅读约需2分钟。发表于: 。基于对数据集特征的广泛分析,我们提出了一种新的弱监督语义分割框架,通过使用对驾驶场景数据集进行定制化处理,克服了现有技术在这类数据集上性能严重降低的挑战,并针对 Contrastive Language-Image Pre-training(CLIP)引入的两个关键挑战提出了解决方案。
这项研究利用预训练模型CLIP和SAM解决弱监督语义分割问题。通过生成高质量的分割种子,使用多标签对比损失和CAM激活损失进行学习。实验证明,在PASCAL VOC 2012和MS COCO 2014上取得了优秀的结果。