细节决定成败:评估针对细节理解的开放词汇物体检测器
💡
原文中文,约600字,阅读约需2分钟。
📝
内容提要
计算机视觉目标检测取得显著进展,但评估方法和数据集有限。本文提出了一个名为OVDEval的新基准,包括9个子任务,评估常识知识、属性理解、位置理解和对象关系理解。实验证明现有模型在新任务上失败,提出的NMS-AP指标提供了更真实的评估。数据可在https://github.com/om-ai-lab/OVDEval获取。
🎯
关键要点
- 计算机视觉目标检测取得显著进展,但评估方法和数据集有限。
- 提出了名为OVDEval的新基准,包括9个子任务,评估常识知识、属性理解、位置理解和对象关系理解。
- 数据集经过精心创建,提供具有挑战性的负样本,以考验模型的真正理解能力。
- 发现流行的平均精度(AP)指标在细粒度标签数据集上存在问题,提出了NMS-AP指标来解决此问题。
- 实验结果表明,现有顶级OVD模型在新任务上失败,证明了OVDEval数据集的价值。
- NMS-AP指标提供了对OVD模型更真实的评估,传统AP指标可能产生误导性结果。
- 数据可在https://github.com/om-ai-lab/OVDEval获取。
➡️