细节决定成败:评估针对细节理解的开放词汇物体检测器

💡 原文中文,约600字,阅读约需2分钟。
📝

内容提要

计算机视觉目标检测取得显著进展,但评估方法和数据集有限。本文提出了一个名为OVDEval的新基准,包括9个子任务,评估常识知识、属性理解、位置理解和对象关系理解。实验证明现有模型在新任务上失败,提出的NMS-AP指标提供了更真实的评估。数据可在https://github.com/om-ai-lab/OVDEval获取。

🎯

关键要点

  • 计算机视觉目标检测取得显著进展,但评估方法和数据集有限。
  • 提出了名为OVDEval的新基准,包括9个子任务,评估常识知识、属性理解、位置理解和对象关系理解。
  • 数据集经过精心创建,提供具有挑战性的负样本,以考验模型的真正理解能力。
  • 发现流行的平均精度(AP)指标在细粒度标签数据集上存在问题,提出了NMS-AP指标来解决此问题。
  • 实验结果表明,现有顶级OVD模型在新任务上失败,证明了OVDEval数据集的价值。
  • NMS-AP指标提供了对OVD模型更真实的评估,传统AP指标可能产生误导性结果。
  • 数据可在https://github.com/om-ai-lab/OVDEval获取。
➡️

继续阅读