基于 CLIP 的栅格拼图表示:图像聚类的新视角
原文中文,约300字,阅读约需1分钟。发表于: 。无监督表征学习在计算机视觉中对图像聚类至关重要。本论文介绍了基于拼图策略的图像聚类算法 Grid Jigsaw Representation(GJR),并创新了基于预训练的 Grid Jigsaw Representation(pGJR),两者在图像聚类任务上表现出较高的有效性和收敛速度。
该论文提出了一种循环框架,用于联合无监督学习的深度表示和图像聚类。该模型通过在CNN输出的表示层上堆叠聚类算法的连续操作的循环过程,在前向传递中进行图像聚类,在后向传递中进行表示学习。该方法在各种图像数据集的图像聚类中表现优于现有技术,并且学习到的表示在转移到其他任务时具有很好的通用性。