通过双重表示对齐进行无监督部件发现
原文中文,约500字,阅读约需2分钟。发表于: 。本研究解决了部件级表示学习在计算机视觉中的关注不足问题。提出了一种新颖的无监督部件特定注意力学习方法,通过对成对图像进行几何变换提取多个部件表示,并与特征图进行对齐,从而显著提高部件发现的性能。实验证明,该方法在多个数据集上取得了竞争力的表现与鲁棒性。
本文介绍了一种基于自监督 DINOv2 ViT 的预训练 Transformer 视觉模型,放宽了对几何属性的限制。该模型通过允许任意大小的多个连通成分的总变差(TV)先验,在细粒度分类任务和部分发现指标上取得了显著改进。