小红花·文摘

本文探讨了候选伪标签学习方法（CPL）和标签对齐方法（LAMM）在提升视觉-语言模型（VLMs）无标签数据性能方面的应用。研究表明，利用大型语言模型（LLM）生成的类别描述和层次化提示学习方法，显著改善了多标签图像识别效果，尤其在零样本识别任务中表现突出。实验结果显示，该方法在多个数据集上超越了现有技术。