人机交互检测综述
原文中文,约2100字,阅读约需5分钟。发表于: 。本文针对人机交互检测领域关键问题,系统总结了基于图像的人机交互检测的最新发展。通过分析主流的数据集及不同检测方法的优缺点,本研究揭示了零样本学习和大规模语言模型在这一领域的潜力,指出了当前的挑战及未来研究方向。
本文总结了基于图像的人机交互检测的最新发展,包括零样本学习、大规模语言模型、交互点学习、HOI Transformer、场景图信息、视觉-语言知识蒸馏、系统性泛化、诊断工具箱、人物-物体解耦网络和基于基础模型的空间提示学习等方法。这些方法在不同数据集上取得了优秀的性能,推动了人机交互检测领域的进步。