研究人员通过在预训练的CLIP模型上添加附加层,提出了一种利用预训练视觉-语言模型进行进一步调整的方法。他们发现线性适配器层是最有效的解决方案,并通过实验证明该方法显著改进了现有技术水平。
完成下面两步后,将自动完成登录并继续当前操作。