DEMO:高效的图像文本匹配的统计视角
原文中文,约300字,阅读约需1分钟。发表于: 。DEMO 是一种用于高效图像 - 文本匹配的新型哈希方法,通过使用多个扩增视角来刻画每个图像,并通过非参数分布差异度量确保稳健且精准的相似性结构,同时引入协作一致性学习来在 Hamming 空间中保持相似性结构、鼓励不同方向的检索分布的一致性,并通过在三个基准图像 - 文本匹配数据集上的广泛实验验证 DEMO 相较于多种最先进方法具有卓越性能。
DEMO是一种新型哈希方法,用于高效图像-文本匹配。它使用多个扩增视角来描述每个图像,并通过非参数分布差异度量确保稳健且精准的相似性结构。DEMO在Hamming空间中保持相似性结构,并鼓励不同方向的检索分布的一致性。在三个基准图像-文本匹配数据集上的实验表明,DEMO具有卓越性能。