通过处理背景样本提升开放词汇物体检测
发表于: 。本研究解决了开放词汇物体检测中CLIP模型在处理背景图像时的性能不足问题。我们提出了背景信息表示(BIRDet),通过动态场景信息替代传统的固定背景嵌入,并引入部分物体抑制(POS)算法,显著提升了检测性能。实验结果表明,该方法在OV-COCO和OV-LVIS基准上表现出色,提升了开放词汇检测器的准确性。
本研究解决了开放词汇物体检测中CLIP模型在处理背景图像时的性能不足问题。我们提出了背景信息表示(BIRDet),通过动态场景信息替代传统的固定背景嵌入,并引入部分物体抑制(POS)算法,显著提升了检测性能。实验结果表明,该方法在OV-COCO和OV-LVIS基准上表现出色,提升了开放词汇检测器的准确性。