小红花·文摘

研究提出了一种双原型演变（DPE）方法，解决视觉语言模型在测试时无法有效积累任务特定知识的问题。DPE通过文本和视觉原型提升多模态表示的精准度，在15个基准数据集上表现优于现有方法，并提高了图像分类和文本检索任务的泛化能力和准确性。