多模态物体识别的鲁棒性领域泛化
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
本论文提出了一种新颖的方法OGEN来改善视觉-语言模型在未知类别上的表现。通过引入类条件特征生成器,合成OOD特征,并使用自适应自蒸馏机制防止过度拟合。实验证实,该方法在不同设置下提供了令人信服的OOD泛化性能增益。
🎯
关键要点
- 视觉-语言模型在微调后可能会过度拟合已知类别,导致对未知类别的表现下降。
- 提出了一种新颖的方法OGEN,旨在改善模型对未知类别的泛化能力。
- 引入类条件特征生成器,通过未知类别的类名合成OOD特征,提供有用知识。
- 合成特征有助于规范ID和OOD数据之间的决策边界。
- 采用自适应自蒸馏机制,防止特征生成模型的过度拟合。
- 实验证明该方法在不同设置下显著提升了OOD泛化性能。
➡️