CLIP3D-AD:使用多视角图像生成扩展 CLIP 进行 3D 小样本异常检测
原文中文,约300字,阅读约需1分钟。发表于: 。我们在本文中提出了 CLIP3D-AD,一种有效的应用于 3D-FSAD 的方法,通过合成异常图像来实现基于 CLIP 的 3D 异常分类和分割,通过融合多视角图像的特征来加强视觉 - 语言相关性。
我们提出了一个名为CLIP-ADA的框架,用于通过适应预训练的CLIP模型进行异常检测。该框架引入可学习的提示,并通过自监督学习将其与异常模式关联起来,从而实现多类别工业图像上的统一异常检测。通过引入异常区域细化策略,充分利用CLIP的表示能力来提高定位质量。在MVTec-AD和VisA上,我们的框架取得了97.5/55.6和89.3/33.1的最新成果,并在极小的训练数据下取得了令人鼓舞的性能。