OpenStreetView-5M:全球可视化地理定位之多种路径
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
该论文构建了一个大规模数据集,研究了城市视觉定位中现有技术的性能,并设计了一种高度可扩展的训练技术CosPlace,能在多个数据集上实现最先进的表现。该技术减少了GPU内存需求并在描述符更小的情况下取得更好的结果。
🎯
关键要点
- 构建了一个30倍于现有最大数据集的San Francisco eXtra Large数据集。
- 研究了现有技术在城市视觉定位应用中的性能表现。
- 设计了一种高度可扩展的训练技术CosPlace,将训练模型作为分类问题。
- 避免了常用对比学习的昂贵挖掘技术。
- CosPlace在多个数据集上实现了最先进的表现。
- 相对于现有技术,CosPlace减少了约80%的GPU内存需求。
- 在描述符更小的情况下取得了更好的结果。
➡️