本文介绍了一种解决组合式零样本学习中上下文问题、视觉特征可辨识性问题和真实世界组合数据长尾分布问题的方法。该方法使用Composition Transformer框架提取物体嵌入,并通过对象引导注意力模块生成属性嵌入。同时,还提出了少数类属性增广方法来解决数据分布不平衡问题。该方法在多个基准测试集上达到了最先进的性能,并有效提高了视觉辨识能力和解决模型偏差。
完成下面两步后,将自动完成登录并继续当前操作。