TMCIR: Advantages of Token Merging in Composed Image Retrieval
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了TMCIR框架,解决组合图像检索中视觉与文本信息融合的偏差问题。通过意图感知的跨模态对齐和自适应标记融合,提升了特征检索的平衡性与准确性,实验结果表明其在捕捉用户意图方面优于现有方法。
🎯
关键要点
- 本研究提出了TMCIR框架,旨在解决组合图像检索中视觉与文本信息融合的偏差问题。
- TMCIR框架通过意图感知的跨模态对齐和自适应标记融合,提升了特征检索的平衡性与准确性。
- 实验结果表明,TMCIR在捕捉用户意图方面显著优于现有的最先进方法。
➡️