小红花·文摘

本文介绍了一种零样本物体检测方法，通过融合语义属性和视觉特征，提高了未知对象的检测精度。研究提出了多种技术和数据集，以应对对象属性预测的挑战，并在多个基准上取得显著改进。此外，探索了基于语言描述和图像样例的多模态分类器，显示出优于传统方法的性能。

用于开放检测的属性丰富数据集及自动注释管道

BriefGPT - AI 论文速递 ·

OVMR是一种用于开放词汇识别的方法，通过将文本描述和示例图像输入到视觉-语言模型中，生成多模态分类器。它使用无参数融合模块来自适应地融合单模态和多模态分类器。实验结果表明，OVMR在图像分类和目标检测任务中表现优于其他方法。

OVMR：华为北大联手，基于多模态融合的SOTA开放词汇识别 | CVPR 2024 - 晓飞的算法工程笔记

晓飞的算法工程笔记 ·

本文介绍了DetCLIPv2和T-Rex2等多种改进的物体检测模型，利用大规模图像-文本对进行开放词汇目标检测，显著提升检测性能。研究探索了多模态分类器和动态词汇生成，提出新的视觉提示方法和OSR-ViT框架，展示了在低数据场景中的优越表现，推动开放世界目标检测的发展。

更多的图像意味着更多：用于开放集物体检测的视觉交集网络

BriefGPT - AI 论文速递 ·

本文介绍了多种目标检测技术的进展，包括DynamicDet动态框架、Cascade-DETR高质量检测和YOLO-Med多任务网络。研究者提出了基于语言描述和图像样例的多模态分类器，展示了其在多类目标检测中的优势。此外，UniDetector和OV-Uni3DETR等模型在开放世界和3D检测中表现出色，均衡了准确性与速度，实验结果显示这些新方法在多个数据集上取得了显著改进。

CerberusDet：统一多任务目标检测

BriefGPT - AI 论文速递 ·

本文研究了无遮挡多类目标检测，提出了三种方法：使用语言描述、图像样例或两者结合。通过大型语言模型生成描述，结合视觉聚合器和多模态分类器，实验结果表明新方法优于传统方案，尤其在开放词汇目标检测和新颖类分类上表现突出。

利用元提示表示和实例对比优化的开放词汇目标检测

BriefGPT - AI 论文速递 ·