本研究探讨自适应范式协同(APS)在长尾数据集上提升自监督学习性能的效果。APS结合自监督与监督学习的优点,通过动态调整潜在空间结构,显著改善了长尾数据集的表现,展示了两者整合的潜力。
本文介绍了CLIP-Adapter和Candle框架等多种视觉语言模型的改进方法,旨在提升长尾数据集的视觉识别能力。研究探讨了类别再平衡和信息增强等技术,提出了新颖的特征学习方法,显著提高了模型的鲁棒性和识别性能。
DeiT-LT是一种在长尾数据集上应用的高效ViT模型,通过蒸馏CNN知识和使用分布外图像来增强对尾类的关注。DeiT-LT使用经过SAM训练的CNN教师来提取低秩泛化特征,通过训练方案,DIST和CLS标记成为尾类和头类的专家。DeiT-LT在长尾数据集上从头训练ViT,提高了性能。
完成下面两步后,将自动完成登录并继续当前操作。