长尾识别的均匀分布类别原型引导视觉语言框架

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文提出了一种基于统一类别原型导向的视觉语言框架,用于解决数据不平衡引起的特征空间偏差和分类器的正向偏差问题。通过去除无关噪声文本和增强关键属性信息的模块,提高了模型的鲁棒性。实验证明,该方法在长尾学习中表现出更优越的性能。

🎯

关键要点

  • 提出了一种基于统一类别原型导向的视觉语言框架。
  • 该框架用于解决数据不平衡引起的特征空间偏差和分类器的正向偏差问题。
  • 通过去除无关噪声文本,提高模型的鲁棒性。
  • 增强关键属性信息的模块进一步提升模型性能。
  • 实验证明该方法在长尾学习中表现出更优越的性能。
➡️

继续阅读