多模态物体识别的鲁棒性领域泛化

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

本论文提出了一种新颖的方法OGEN来改善视觉-语言模型在未知类别上的表现。通过引入类条件特征生成器,合成OOD特征,并使用自适应自蒸馏机制防止过度拟合。实验证实,该方法在不同设置下提供了令人信服的OOD泛化性能增益。

🎯

关键要点

  • 视觉-语言模型在微调后可能会过度拟合已知类别,导致对未知类别的表现下降。
  • 提出了一种新颖的方法OGEN,旨在改善模型对未知类别的泛化能力。
  • 引入类条件特征生成器,通过未知类别的类名合成OOD特征,提供有用知识。
  • 合成特征有助于规范ID和OOD数据之间的决策边界。
  • 采用自适应自蒸馏机制,防止特征生成模型的过度拟合。
  • 实验证明该方法在不同设置下显著提升了OOD泛化性能。
➡️

继续阅读