揭示组成式零样本学习中的近邻长尾分布
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
本文介绍了使用Composition Transformer(CoT)框架解决组合式零样本学习(CZSL)中的上下文问题、视觉特征可辨识性问题和真实世界组合数据的长尾分布问题的方法。CoT框架通过自下而上提取物体嵌入,并通过自上而下生成属性嵌入。同时,提出了少数类属性增广(MAA)方法解决数据分布不平衡引起的预测偏差。该方法在多个基准测试集上达到最先进性能,并展示了提高视觉辨识能力和解决数据分布不平衡的有效性。
🎯
关键要点
- 使用Composition Transformer(CoT)框架解决组合式零样本学习(CZSL)中的上下文问题、视觉特征可辨识性问题和长尾分布问题。
- CoT框架通过自下而上提取物体嵌入,并通过自上而下生成属性嵌入。
- 提出少数类属性增广(MAA)方法,通过混合图像和过采样少数类属性合成虚拟样本,解决数据分布不平衡引起的预测偏差。
- 该方法在多个基准测试集上达到最先进性能,包括MIT-States、C-GQA和VAW-CZSL。
- 展示了CoT在提高视觉辨识能力和解决模型偏差方面的有效性。
➡️