小红花·文摘

【效果逆天】零样本工业缺陷改变工业质检，颠覆YOLO系列模型效果

gloomyfish ·

工业质检新王者 - 多模态大模型零样本缺陷检测

gloomyfish ·

【最新技术】多模态零样本工业缺陷检测概述

gloomyfish ·

本研究提出了一种多尺度符合预测的零样本机器生成文本检测框架，旨在降低虚假正例率（FPR）带来的社会风险。该框架有效限制FPR上限，并提升检测性能，实证结果在多个检测器和数据集上表现显著。

Reliably Bounding False Positives: A Zero-Shot Machine-Generated Text Detection Framework via Multiscaled Conformal Prediction

BriefGPT - AI 论文速递 ·

本研究提出了一种新方法，结合大语言模型与视觉语言模型，解决视频异常检测中的可解释性和时间推理挑战，提升检测能力，推动少样本和零样本检测应用。

异类检测何去何从？大语言模型和视觉语言模型的聚焦

BriefGPT - AI 论文速递 ·

本研究探讨大型语言模型在异常检测中的应用，提出AD-LLM基准，评估其在零样本检测、数据增强和模型选择方面的表现，结果表明LLM在零样本异常检测中效果显著，为未来研究提供了指导。

AD-LLM: Evaluation of Large Language Models in Anomaly Detection

BriefGPT - AI 论文速递 ·

本文介绍了一种零样本物体检测方法，通过融合语义属性和视觉特征，提高了未知对象的检测精度。研究提出了多种技术和数据集，以应对对象属性预测的挑战，并在多个基准上取得显著改进。此外，探索了基于语言描述和图像样例的多模态分类器，显示出优于传统方法的性能。

用于开放检测的属性丰富数据集及自动注释管道

BriefGPT - AI 论文速递 ·

HOI Transformer是一种用于人-物交互检测的算法，通过全局图像上下文推断物体与人的关系，提升了HICO-DET和V-COCO数据集的性能。研究还提出了基于视觉-语言知识蒸馏的零样本人-物交互检测框架，利用CLIP模型实现更准确的检测。新开发的MP-HOI检测器通过多模态提示和大规模数据集优化HOI任务，展现出卓越的零样本能力和广泛应用潜力。

不再看不见：解锁CLIP在生成零-shot人机交互检测中的潜力

BriefGPT - AI 论文速递 ·

本文提出了一种基于transformer的特征提取器KI2HOI，改进了零样本人物-物体交互检测。通过动词提取解码器和视觉语义模块，该模型在HICO-DET和V-COCO数据集上表现优异。同时，采用虚拟图像学习和功能相似性方法，解决了类别不平衡问题，显著提升了检测精度。

通过填补领域差距来检测稀有的人 - 物交互的即插即用方法

BriefGPT - AI 论文速递 ·

本研究探讨了自然语言生成与零样本机器生成文本检测的关系，提出了基于贝叶斯模型和条件概率的多种新型检测方法。结果表明，中等规模语言模型的检测器在零样本推广中表现良好，并在多种代码和文本分类场景中展现出较高的准确性和鲁棒性。

谁写的？零样本长文本生成文本检测的关键是 GECScore

BriefGPT - AI 论文速递 ·

本文探讨了在自动驾驶系统中利用激光雷达（LiDAR）进行无监督3D物体检测的方法，提出了自监督学习、稀疏监督协作框架和基于原型的零样本检测等技术，显著提高了检测准确性并降低了标注成本。实验结果显示这些方法在多个数据集上表现优越，展示了自我监督与对象先验结合的潜力。

户外无监督三维物体检测常识原型

BriefGPT - AI 论文速递 ·

本研究提出了KI2HOI框架，结合视觉语言模型和大型语言模型，改进了零样本人物-物体交互检测。通过动词提取和交互表示解码器，该模型在HICO-DET和V-COCO数据集上表现优异，提升了交互理解和检测性能。

探索大型基础模型在开放词汇 HOI 检测中的潜力

BriefGPT - AI 论文速递 ·

该研究提出了一种基于CLIP的人-物交互（HOI）检测框架，通过多种模块提取知识，提高了检测准确性，在HICO-Det数据集上提升了4.04 mAP。此外，研究还探索了零样本人-物交互检测，结合强弱监督数据的方法，显著提升了模型的鲁棒性和性能。实验结果表明，该方法在多个数据集上表现优异，具有实用价值。

通过视觉语言集成实现零样本人 - 物体交互检测

BriefGPT - AI 论文速递 ·

本文介绍了我们在VAND 2023 Challenge中的零样本检测方向的提交结果，通过增强WINCLIP框架的定位能力和整合零样本分割模型，我们在VAND挑战赛中排名第三，实现了VisA数据集上的平均F1-max得分为81.5/24.2。

MuSc：无标签图像的零样本工业异常分类与分割

BriefGPT - AI 论文速递 ·