本研究重新思考了图像检索中的稀疏词汇表示,利用多模态大型语言模型提取图像特征。通过数据增强和关键字扩展,该方法在多个数据集上展现了更高的精准度和召回率,对关键词为基础的图像检索场景有重要影响。
完成下面两步后,将自动完成登录并继续当前操作。