CL-HOI: Cross-Level Human-Object Interaction Distillation Based on Vision Large Language Models

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出了一种名为CL-HOI的跨层人机交互蒸馏框架,旨在减少对人工标注的依赖。通过从视觉大语言模型中提取交互信息,CL-HOI在HICO-DET和V-COCO数据集上表现优于传统方法,验证了其在无标注条件下的有效性。

🎯

关键要点

  • 本研究提出了一种名为CL-HOI的跨层人机交互蒸馏框架,旨在减少对人工标注的依赖。
  • CL-HOI通过从视觉大语言模型中提取实例级的交互信息,提供了一种无须人工标注的方法。
  • 在HICO-DET和V-COCO数据集上,CL-HOI的表现优于传统的弱监督和VLLM监督方法。
  • 研究结果验证了CL-HOI在无标注条件下的有效性。
➡️

继续阅读