小红花·文摘

量子位 ·

本研究提出了TMCIR框架，解决组合图像检索中视觉与文本信息融合的偏差问题。通过意图感知的跨模态对齐和自适应标记融合，提升了特征检索的平衡性与准确性，实验结果表明其在捕捉用户意图方面优于现有方法。

BriefGPT - AI 论文速递 ·

本研究提出了FineCIR框架，旨在解决组合图像检索中因粗粒度修改文本导致的检索不准确问题。通过细粒度数据标注，FineCIR在FashionIQ和CIRR数据集上显著提高了检索精度，优于现有方法。

BriefGPT - AI 论文速递 ·

本文介绍了一种新方法，通过多模态信息融合实现零样本组合图像检索（CIR），在CIRR和FashionIQ等数据集上表现优异。提出的SEARLE和LinCIR方法无需标记数据，利用视觉特征和文本描述提高检索准确性，实验结果显示这些方法在多个基准测试中超越了现有技术，展现出良好的泛化性能。

BriefGPT - AI 论文速递 ·

本文提出了可扩展的组合图像检索（CoIR）任务，并扩展至组合视频检索（CoVR）。通过生成160万个三元组的WebVid-CoVR数据集，实验证明在该数据集上训练的CoVR模型能有效提升检索性能。研究还展示了如何利用多模态信息和新型模型提高视频检索的准确性和效率。

BriefGPT - AI 论文速递 ·

本文提出了一种新的基于零样本训练的无需训练的组合图像检索方法(TFCIR)，通过将查询翻译成易于理解的文本，提高计算效率并保持模型的泛化性。实验证明该方法在多个基准测试上实现了与最先进方法相当的性能，并明显优于其他无需训练的方法。

BriefGPT - AI 论文速递 ·

本文提出了一种基于排名感知的不确定性方法，通过建模多对多的对应关系，学习特征的随机排名列表，并对源输入和目标图像的分布表示进行规范化。在组合图像检索的两个公共数据集上取得了显著结果。

BriefGPT - AI 论文速递 ·