小红花·文摘

本研究分析了视觉-语言模型CLIP的零样本学习能力，提出了小样本微调和对抗微调方法，显著提高了模型在对抗攻击下的鲁棒性。同时，通过新颖的文本图像相互感知方法，增强了模型的分类稳健性，强调了提升零样本多模态模型鲁棒性的重要性。

文本引导注意力是实现视觉语言模型零样本鲁棒性的全部需要

BriefGPT - AI 论文速递 ·

本文探讨了视觉-语言模型在处理视觉信息时的有效性，尤其是在有限样本情况下的鲁棒性。研究表明，适应方法对文本污染更敏感，而完整微调不一定能提供最佳鲁棒性。提出了小样本微调方法，以提升模型在真实世界数据中的表现，并强调了视觉基础模型在生成与判别任务中的潜力与挑战。

视觉-语言基础模型是否表现出稳健的视觉感知？

BriefGPT - AI 论文速递 ·

本文探讨了优化学习提示的多种方法，包括量化神经网络、视觉语言模型的适应性调整和小样本微调技术。这些方法在不同数据集上显著提升了模型的泛化能力和准确性，尤其在处理现实世界数据时表现优异。

视觉 - 语言模型的高效泛化的量化提示

BriefGPT - AI 论文速递 ·

本文提出了一种名为Domain Aligned CLIP (DAC)的小样本微调方法，旨在提升视觉-语言基础模型CLIP的内部和跨模态对齐效果。实验结果显示，DAC在多个图像分类任务中表现优越，尤其在样本分类挑战中提升了2.3%。研究还探讨了微调模型在未知类别上的泛化能力，提出了类条件特征生成器和自适应自蒸馏机制，以防止过度拟合并增强模型的鲁棒性。

基于锚点的视觉语言模型的鲁棒微调

BriefGPT - AI 论文速递 ·

传统迁移学习在有限数据和分布转变下效果有限。最近的CLIP模型在零样本推理和鲁棒性方面表现出色。提出了适用于CLIP的小样本微调方法，并在具有分布转变的基准数据集上评估。实验证明，少样本CLIP微调在准确性方面优于只有视觉的模型，为小样本学习应用提供了动力。

预训练模型引导的零样本对抗鲁棒性微调

BriefGPT - AI 论文速递 ·