好的开放式字词探测器的要素:一个拆解的视角
原文中文,约600字,阅读约需2分钟。发表于: 。开放词汇检测(OVD)是一种新的目标检测范式,旨在定位和识别由不受限词汇定义的未知对象。本文提出了三种 OVD 方法,并通过实验验证了这些方法在不同设置下的性能。其中,DRR 方法在 OVD-COCO 基准测试中取得了最佳表现,并相对于先前最先进水平获得了 2.8 的 AP$_{50}$ 绝对增益。
计算机视觉中的目标检测取得了显著进展,但评估方法和数据集有限。本文提出了名为OVDEval的新基准,包括9个子任务,评估常识知识、属性理解、位置理解和对象关系理解等。数据集提供了具有挑战性的负样本。提出了新指标NMS-AP来解决现有指标问题。实验结果表明,现有的顶级OVD模型在新任务上失败,证明了所提出数据集的价值。