基于语义增强的少样本检测,突破新类别偏见 | ICIP'24 - 晓飞的算法工程笔记
原文中文,约4900字,阅读约需12分钟。发表于: 。Few-shot目标检测(FSOD)旨在在有限标注实例的情况下检测新颖对象,在近年取得了显著进展。然而,现有方法仍然存在偏见表示问题,特别是在极低标注情况下的新颖类别。在微调过程中,一种新颖类别可能会利用来自相似基础类别的知识来构建自己的特征分布,导致分类混淆和性能下降。为了解决这些挑战,论文提出了
本文介绍了一种基于微调的Few-shot目标检测(FSOD)框架,解决了在极低标注情况下的新颖类别偏见表示和分类混淆问题。该框架利用语义嵌入提高检测性能,引入多模态特征融合增强视觉-语言通信,并提出语义感知最大间隔损失避免类别混淆。实验结果显示,该方法在PASCAL VOC和MS COCO数据集上性能显著提升。