Nearest Neighbor Normalization Improves Multimodal Retrieval
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了一种名为最近邻规范化(NNN)的方法,旨在提升大规模预训练模型在图像描述、视觉问答和跨模态检索中的性能。该方法无需额外训练,显著改善了文本与图像检索的效果,具有广泛的应用潜力。
🎯
关键要点
- 本研究提出了一种名为最近邻规范化(NNN)的方法,旨在提升大规模预训练模型在多模态任务中的性能。
- NNN方法无需额外训练,能够有效纠正训练好的对比图像-文本检索模型的错误。
- 该方法显著改善了文本与图像检索的效果,展示了广泛的应用潜力。
➡️