BriefGPT - AI 论文速递 ·

EUFCC-CIR：用于GLAM收藏的组合图像检索数据集

💡 原文中文，约1500字，阅读约需4分钟。

📝

内容提要

本研究提出了多种新方法和数据集，以提升文化遗产领域的图像检索技术，包括细粒度艺术品属性识别、Zero-Shot CIR任务及其数据集CIRCO，以及使用合成标签的混合检索方法HyCIR。这些方法通过计算机视觉和多标签标注，显著提高了图像检索的准确性和效果。

🎯

🔎

细粒度艺术品属性识别的新数据集为数字博物馆的文物数字化提供了重要支持。通过精确识别艺术品中的特定属性，研究者能够更好地管理和展示文化遗产，提升用户的检索体验。

Zero-Shot CIR任务的提出，标志着图像检索技术的一次重要突破。该方法不依赖于标记数据集，降低了数据准备的成本，同时也为没有丰富标注资源的领域提供了新的解决方案，具有广泛的应用潜力。

EUFCC340K数据集的推出，旨在改善文化遗产领域的自动元数据注释。其丰富的图像和多维度的组织方式，能够有效支持多标签分类任务，帮助文化遗产机构提高编目效率，减轻人工负担。

❓

EUFCC340K数据集包含超过340,000张图像，按照材料、对象类型、学科和主题等多个维度进行组织，旨在改善文化遗产领域的自动元数据注释。

Zero-Shot CIR任务不需要标记数据集，能够通过视觉特征和文本描述进行检索，降低了对标记数据的依赖。

HyCIR方法使用合成标签和对比学习策略，结合合成CIR三元组，提升了零样本图像检索的性能。

DEArt是一个针对文化遗产绘画的检测数据集，具有69个类别和12个姿势，支持迁移学习，能够实现与最先进模型相媲美的精度。

CIReVL方法通过大规模视觉语言模型和CLIP进行检索，提供了一种简单且可扩展的方式，取得了与有监督方法相竞争的性能。

Pic2Word方法可以在没有标记三元组的情况下，使用弱标记和未标记的数据集训练出具有良好泛化性能的CIR模型。

🏷️