本文介绍了一种高效的端到端管道,用于大规模地标识别和检索。作者提出了两种特别适用于大规模地标识别的架构,并详细阐述了一种新的判别式重新排名方法用于图像检索。
本文介绍了一种高效的端到端管道,用于大规模地标识别和检索。作者提出了两种特别适用于大规模地标识别的架构:深度正交融合的全局和局部特征模型(DOLG)和一种新的混合Swin变换器。作者讨论了如何使用逐步方法高效地训练这两种架构,并提供了一个具有动态边缘的子中心Arcface损失。此外,作者还详细阐述了一种新的判别式重新排名方法用于图像检索。作者通过赢得Google Landmark竞赛2021的识别和检索赛道证明了该方法的卓越性能。
完成下面两步后,将自动完成登录并继续当前操作。