本文讨论了自监督视觉模型DINO及其在目标检测中的应用,重点介绍了Grounding DINO和DINO-X。Grounding DINO通过语言信息将闭集检测器扩展到开放集场景,采用双编码器-单解码器架构,结合图像和文本特征进行对象检测,创新设计了特征提取、增强和查询选择等方面,以提升检测性能。
该研究提出了一种新框架,通过微调开放集对象检测器,整合遥感图像中的对象检测与视觉定位,显著提高了检测效果。
本研究提出低样本开放集领域泛化(LSOSDG),结合低样本学习与开放集领域泛化。OSLOPROMPT框架通过域无关提示学习和针对性查询策略,显著提升了学习效果和开放样本检测精度,在五个基准测试中创下新纪录。
本研究提出了一种基于能量的主动开放集标注框架(EAOA),旨在解决主动学习在开放集类别中的挑战。该框架通过整合认知不确定性和随机不确定性,采用自适应采样策略,提高了查询精度和模型性能,效果优于现有方法。
该研究提出了一种双重概率对齐框架,有效解决了领域自适应物体检测中的开放集、部分集和闭合集域适应性问题,显著提升了检测性能。
本研究提出UADet框架,旨在解决开放集目标检测中的关键问题,能够在无标签图像中有效识别已知和未知对象,显著提升未知对象的召回率。
本研究提出特征空间语义不变性(FSI)框架,以解决开放集领域泛化中的未知类别样本检测问题。实验结果表明,该方法在ColoredMNIST数据集上的AUROC提升了9.1%至18.9%。
本研究提出了一种新学习方法,解决开放集单源域泛化中的源域稀缺性和目标域未知数据分布问题。通过背景抑制和风格增强合成新样本,扩展类间边界,显著提升未知类识别能力。实验结果在多个跨域图像分类数据集上表现优异。
全景场景图生成(PSG)旨在分割图像中的对象并识别其关系。传统方法仅适用于封闭集,无法处理开放集关系。本文提出OpenPSG,结合预训练模型,实现开放集关系预测。通过引入关系查询变换器,提取对象对特征并判断关系,显著提升预测效率。实验结果表明,OpenPSG在开放集关系预测和全景场景图生成方面表现优异。
本研究提出了一种新的伪造风格混合方案,利用轻量级视觉变换器提升开放集人脸伪造检测的泛化能力,减少参数并提高性能。
完成下面两步后,将自动完成登录并继续当前操作。