BriefGPT - AI 论文速递 ·

LPT++：高效训练长尾专家的混合模型

💡 原文中文，约1800字，阅读约需5分钟。

📝

内容提要

本文介绍了一种基于ACE的长尾识别方法，显著提升了CIFAR和ImageNet等数据集的性能。通过对比学习和视觉-语言结合，提出了高效的Prompt调整方法和动态调整技术，优化了视觉变换器的适应性和推理效率，验证了在多种任务中的优越表现。

🎯

❓

基于ACE的单阶长尾识别方法在不需要专门分类器预训练的情况下，显著提升了多个数据集的性能，改善了多数和少数类别的准确性。

VPT在存储成本和性能上优于传统的微调方法，仅在输入空间中引入少量可训练参数，且在许多任务中表现更佳。

DyT通过使用轻量级适配器模块和标记分发器，动态跳过不重要的标记，减少冗余计算，从而提高推理效率。

LiVT模型使用Masked Generative Pretraining和Balanced Binary Cross Entropy进行训练，以优化模型性能。

该方法使用两个阶段的培训范例来学习可调节的提示符，以实现有效的长尾分类。

DyT在图像/视频识别和语义分割任务中表现优越，能够在减少计算量的情况下实现与现有方法相当或更好的性能。

🏷️