小红花·文摘

本文探讨了如何通过调整预训练的CLIP模型来优化视觉与语言任务的学习效果。研究提出了线性适配器和自注意适配器等方法，强调了参数保留的重要性，以提高模型在新任务中的适应性。实验结果表明，这些方法在小样本学习和长尾识别任务中显著提升了性能。