小红花·文摘

本研究提出了TULIP模型，旨在改善现有图像-文本对比模型在视觉任务中的不足。通过数据增强和对比学习，TULIP能够更有效地学习细粒度视觉特征，并保持全局语义一致性。实验结果显示，TULIP在多个基准测试中超越了现有模型，尤其在零-shot任务和少量样本分类上表现显著提升。