如何评估检测的泛化能力?一种用于综合开放词汇检测的基准测试
原文中文,约600字,阅读约需2分钟。发表于: 。计算机视觉中的目标检测在最近几年取得了显著进展,从基于闭集标签到基于大规模视觉语言预训练的开放词汇检测,然而,当前的评估方法和数据集仅限于测试对象类型和参考表达的泛化能力,这并不能提供一个系统、细粒度和准确的 OVD 模型能力的基准。本文提出了一个名为 OVDEval 的新基准,包括 9...
计算机视觉中的目标检测取得了进展,但评估方法和数据集有限。本文提出了名为OVDEval的新基准,包括9个子任务,评估常识知识、属性理解、位置理解和对象关系理解等。实验结果显示,现有的顶级OVD模型在新任务上失败。同时,提出的NMS-AP指标提供了对OVD模型的更真实评估。