面向文本属性的隐式模态对齐的人物搜索

📝

内容提要

通过 Attribute-Aware Implicit Modality Alignment (AIMA) 框架,使用 CLIP 模型及 Attribute-IoU Guided Intra-Modal Contrastive (A-IoU IMC) Loss,实现了文本属性人物搜索中文本属性与图像之间的对齐和表示匹配,进一步优化了语义排列。

➡️

继续阅读