本文探讨了候选伪标签学习方法(CPL)和标签对齐方法(LAMM)在提升视觉-语言模型(VLMs)无标签数据性能方面的应用。研究表明,利用大型语言模型(LLM)生成的类别描述和层次化提示学习方法,显著改善了多标签图像识别效果,尤其在零样本识别任务中表现突出。实验结果显示,该方法在多个数据集上超越了现有技术。
完成下面两步后,将自动完成登录并继续当前操作。