DiffMatch: 视觉 - 语言指导提升半监督变化检测器的性能
原文中文,约300字,阅读约需1分钟。发表于: 。本文提出了一种基于视觉语言模型的半监督变化检测方法,名为 DiffMatch,通过利用 VLM 合成自由变化标签为无标签数据提供额外的监督信号,并通过辅助分割解码器明确分离双时相图像的语义表示,最终通过特征级对比损失引入度量感知监督,实验证明 DiffMatch 相较于基线方法 FixMatch 在变化检测上具有明显优势。
本文介绍了ChangeCLIP,一种基于可视化-语言预训练的多模态对比学习方法,用于变化检测领域的广义化。同时,提出了动态语境优化的提示学习方法。通过在真实世界的单时序图像上训练模型,ChangeCLIP展现了出色的广义化能力。实验证明ChangeCLIP在真实变化检测数据集上优越性和广义化能力强,超过了现有的最先进方法。代码提供。