ClusVPR:基于聚类加权 Transformer 的高效视觉地点识别
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
StructVPR是一种新型训练体系结构,旨在增强RGB全局特征中的结构知识,提高特征稳定性。它使用分割图像作为CNN网络中结构知识输入的源,并应用知识蒸馏来避免在线分割和测试中的Seg-branch推理。在几项基准测试中,StructVPR表现出令人印象深刻的全局检索能力,并且计算成本低。
🎯
关键要点
- StructVPR是一种新的训练体系结构,旨在增强RGB全局特征中的结构知识。
- 该体系结构提高了在不断变化的环境下的特征稳定性。
- StructVPR使用分割图像作为CNN网络中结构知识输入的明确源。
- 应用知识蒸馏以避免在线分割和测试中的Seg-branch推理。
- 在几项基准测试中,StructVPR表现出令人印象深刻的全局检索能力。
- 即使在附加重新排名的情况下,StructVPR仍保持低的计算成本。
➡️