SHiNe: 开放词汇物体检测的语义层级连结

💡 原文中文,约500字,阅读约需2分钟。
📝

内容提要

计算机视觉中的目标检测和分割任务取得了巨大进展,但现有数据集中的标注类别较小且预定义,无法推广到开放词汇之外。近年来,越来越多的关注集中在开放词汇检测和分割上。本调研提供了对过去和最新开放词汇检测和分割发展的全面审查,包括不同方法学的分类和讨论。同时提供了一些有前途的方向,以激发未来的研究。

🎯

关键要点

  • 计算机视觉中的目标检测和分割任务在深度学习时代取得了巨大进展。
  • 现有数据集中的标注类别规模较小且预定义,无法推广到开放词汇之外。
  • 近年来,开放词汇检测(OVD)和分割(OVS)受到越来越多的关注。
  • 本调研提供了对过去和最新OVD和OVS发展的全面审查。
  • 根据任务类型和方法学开发了分类法,涵盖不同的方法学。
  • 不同的方法学包括视觉-语义空间映射、新颖的视觉特征合成等。
  • 弱监督信号的许可和使用可以很好地区分不同的方法学。
  • 所提出的分类法适用于目标检测、语义/实例/全景分割等任务。
  • 详细讨论了每个类别的主要原则、关键挑战、发展路线、优缺点。
  • 对每个方法的关键组成部分进行了基准测试。
  • 提供了一些有前途的方向,以激发未来的研究。
➡️

继续阅读