小红花·文摘

OVMR是一种用于开放词汇识别的方法，通过将文本描述和示例图像输入到视觉-语言模型中，生成多模态分类器。它使用无参数融合模块来自适应地融合单模态和多模态分类器。实验结果表明，OVMR在图像分类和目标检测任务中表现优于其他方法。