AnyOKP: 单次和实例感知的预训练 ViT 目标关键点提取

💡 原文中文,约500字,阅读约需1分钟。
📝

内容提要

该研究提出了一种针对以物体为中心的视觉感知的实例感知对象关键点提取方法,利用预训练视觉转换器进行特征提取,展示了跨类别的灵活性和实例感知性。

🎯

关键要点

  • 提出了一种针对以物体为中心的视觉感知的实例感知对象关键点提取方法(AnyOKP)。
  • 利用预训练视觉转换器(ViT)进行特征提取,展示了跨类别的灵活性和实例感知性。
  • 方法能够在学习支持图像后,为任意类别的多个对象实例获得关键点。
  • 通过训练无需增强特征,直接部署现成的预训练 ViT 进行通用化和可转移的特征提取。
  • 根据外观相似性在支持图像和查询图像中搜索最佳原型对(BPPs),生成候选关键点。
  • 将包含所有候选关键点的整个图根据特征分布划分为子图,每个子图代表一个对象实例。
  • AnyOKP 在真实物体图像上进行了评估,展示了对领域转移和视角变化的显著稳健性。
➡️

继续阅读