在视觉-语言模型的提示学习时代
发表于: 。本研究针对大规模基础模型在领域迁移中的适应性不足问题,提出了一种新颖的与领域无关的提示学习策略StyLIP,通过解耦CLIP视觉编码器中的视觉风格和内容,实现了跨领域的无缝适应。研究发现,此方法在多个领域泛化基准上超越了现有的最先进技术,并为无监督领域适应提出了AD-CLIP,有效应对领域转移问题。
本研究针对大规模基础模型在领域迁移中的适应性不足问题,提出了一种新颖的与领域无关的提示学习策略StyLIP,通过解耦CLIP视觉编码器中的视觉风格和内容,实现了跨领域的无缝适应。研究发现,此方法在多个领域泛化基准上超越了现有的最先进技术,并为无监督领域适应提出了AD-CLIP,有效应对领域转移问题。