视觉地点识别的最优输运聚合
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文介绍了DINO-Mix架构,利用DINOv2模型修剪和微调图像,提取鲁棒的特征。实验证明,DINO-Mix在具有光照变化、季节变化和遮挡的测试集上表现优于当前最先进的方法,准确率提高了5.14%。
🎯
关键要点
- DINO-Mix架构利用DINOv2模型对图像进行修剪和微调,提取鲁棒的图像特征。
- DINO-Mix结合基础视觉模型的特征提取能力和MLP-Mixer的特征聚合模块,实现高精度的视觉定位与重识别(VPR)。
- 实验结果显示,DINO-Mix在光照变化、季节变化和遮挡的测试集上表现优于当前最先进的方法。
- DINO-Mix在测试集上分别达到了91.75%、80.18%和82%的Top-1准确率。
- 与最先进的方法相比,DINO-Mix的平均准确率提高了5.14%。
➡️