小红花·文摘

ALADIN是一种新型图像样式相似度搜索架构，利用微弱监督学习实现数字艺术品的细粒度样式表示。研究提出了StyleBabel数据集，包含135K数字艺术作品的自然语言描述，并结合ALADIN架构和视觉变换器进行样式检索。此外，还提出了ArtSem数据集和多领域艺术品合成框架，通过条件生成对抗网络生成高质量艺术作品，并探讨了无标签数据的艺术图像物体识别方法。

fruit-SALAD：一种风格对齐的艺术作品数据集，以揭示图像嵌入中的相似性感知

BriefGPT - AI 论文速递 ·

ALADIN是一种高效的图文匹配方法，通过图像文本层次对齐产生得分，并通过蒸馏得到的相关性得分学习共享的嵌入空间。该方法速度快，可与最先进的VL Transformer网络相竞争，具有横跨视觉和语言的领先地位。

MCAD: 多教师跨模态对齐蒸馏以实现高效的图像 - 文本检索

BriefGPT - AI 论文速递 ·