CL-HOI: Cross-Level Human-Object Interaction Distillation Based on Vision Large Language Models
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了一种名为CL-HOI的跨层人机交互蒸馏框架,旨在减少对人工标注的依赖。通过从视觉大语言模型中提取交互信息,CL-HOI在HICO-DET和V-COCO数据集上表现优于传统方法,验证了其在无标注条件下的有效性。
🎯
关键要点
- 本研究提出了一种名为CL-HOI的跨层人机交互蒸馏框架,旨在减少对人工标注的依赖。
- CL-HOI通过从视觉大语言模型中提取实例级的交互信息,提供了一种无须人工标注的方法。
- 在HICO-DET和V-COCO数据集上,CL-HOI的表现优于传统的弱监督和VLLM监督方法。
- 研究结果验证了CL-HOI在无标注条件下的有效性。
➡️