小红花·文摘

本文介绍了一种名为Unsupervised Prototype Adapter (UP-Adapter)的无监督微调方法，利用CLIP的文本-图像对齐能力自动选择每个类别中最有信心的样本，并生成类别原型，用于可学习的原型模型的初始化。经过微调后，通过剩余连接将原型模型的预测与原始CLIP的预测相结合，用于下游识别任务。实验结果表明，该方法在图像识别和领域泛化方面取得了显著优势。