小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
让大模型多模态检索全面超越SOTA!ReCALL框架化解生成式与判别式的范式冲突|CVPR’26

ReCALL框架通过“诊断-生成-校准”闭环解决了多模态大模型在检索中的范式冲突,提升了细粒度推理能力,显著提高了组合图像检索的性能,标志着大模型向下游任务迁移的新阶段。

让大模型多模态检索全面超越SOTA!ReCALL框架化解生成式与判别式的范式冲突|CVPR’26

量子位
量子位 · 2026-04-06T15:30:59Z

本研究提出了TMCIR框架,解决组合图像检索中视觉与文本信息融合的偏差问题。通过意图感知的跨模态对齐和自适应标记融合,提升了特征检索的平衡性与准确性,实验结果表明其在捕捉用户意图方面优于现有方法。

TMCIR: Advantages of Token Merging in Composed Image Retrieval

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-15T00:00:00Z

本研究提出了FineCIR框架,旨在解决组合图像检索中因粗粒度修改文本导致的检索不准确问题。通过细粒度数据标注,FineCIR在FashionIQ和CIRR数据集上显著提高了检索精度,优于现有方法。

FineCIR: Explicit Parsing of Fine-Grained Modification Semantics for Composed Image Retrieval

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-27T00:00:00Z

本文介绍了一种新方法,通过多模态信息融合实现零样本组合图像检索(CIR),在CIRR和FashionIQ等数据集上表现优异。提出的SEARLE和LinCIR方法无需标记数据,利用视觉特征和文本描述提高检索准确性,实验结果显示这些方法在多个基准测试中超越了现有技术,展现出良好的泛化性能。

零样本组图检索,考虑到查询目标之间的关系,利用遮罩图像文本对

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-27T00:00:00Z

本文提出了一种新的基于零样本训练的无需训练的组合图像检索方法(TFCIR),通过将查询翻译成易于理解的文本,提高计算效率并保持模型的泛化性。实验证明该方法在多个基准测试上实现了与最先进方法相当的性能,并明显优于其他无需训练的方法。

无训练的零样本组合图像检索和本地概念重新排序

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-12-14T00:00:00Z

本文提出了一种基于排名感知的不确定性方法,通过建模多对多的对应关系,学习特征的随机排名列表,并对源输入和目标图像的分布表示进行规范化。在组合图像检索的两个公共数据集上取得了显著结果。

文本引导的图像检索的排名感知不确定性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-16T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码