AD-CLIP: 利用 CLIP 在提示空间中调适领域

原文约200字,阅读约需1分钟。发表于:

使用 AD-CLIP 解决图像领域适应问题,通过在 prompt 空间中提取图像风格和内容信息,采用标准的有监督对比学习和最小熵策略来对齐源领域和目标领域,同时提出跨领域风格映射网络来生成领域无关的标记,实验证明了 AD-CLIP 的有效性。

本研究提出了一种名为CLIP-TD的方法,通过有针对性的蒸馏来适应每个实例的自适应选择标记。实验证明,CLIP-TD在视觉常识推理、视觉蕴涵推理和视觉问答等任务中,在低量数据和领域迁移条件下取得了显著的增益,并达到了最先进的性能。

相关推荐 去reddit讨论