本文介绍了使用Composition Transformer(CoT)框架解决组合式零样本学习(CZSL)中的上下文问题、视觉特征可辨识性问题和真实世界组合数据的长尾分布问题的方法。该方法在多个基准测试集上达到了最先进的性能,并展示了在提高视觉辨识能力和解决模型偏差方面的有效性。
本文介绍了使用Composition Transformer(CoT)框架解决组合式零样本学习(CZSL)中的上下文问题、视觉特征可辨识性问题和真实世界组合数据的长尾分布问题的方法。CoT框架通过自下而上提取物体嵌入,并通过自上而下生成属性嵌入。同时,提出了少数类属性增广(MAA)方法解决数据分布不平衡引起的预测偏差。该方法在多个基准测试集上达到最先进性能,并展示了提高视觉辨识能力和解决数据分布不平衡的有效性。
完成下面两步后,将自动完成登录并继续当前操作。