BoQ:一个地方值得一袋可学习的查询
原文中文,约300字,阅读约需1分钟。发表于: 。在视觉地点识别中,通过引入一种名为查询包(BoQ)的新技术,该技术学习一组全局查询来捕捉普遍的地点特征,并利用交叉注意力实现一致的信息聚合。BoQ 通过与 CNN 和 Vision Transformer 骨干网络集成,并通过对 14 个大规模基准进行广泛实验表明了卓越的性能。同时,作为一种全局检索技术(一阶段),BoQ 在速度和效率上超过了 Patch-NetVLAD、TransVPR...
这篇文章介绍了一种名为查询包(BoQ)的新技术,它在视觉地点识别中表现出卓越性能。BoQ通过与CNN和Vision Transformer集成,并通过广泛实验证明了其优越性能。同时,BoQ作为一种全局检索技术,在速度和效率上超过了其他两阶段检索方法。