小红花·文摘

本文提出了一种基于transformer的特征提取器KI2HOI，改进了零样本人物-物体交互检测。通过动词提取解码器和视觉语义模块，该模型在HICO-DET和V-COCO数据集上表现优异。同时，采用虚拟图像学习和功能相似性方法，解决了类别不平衡问题，显著提升了检测精度。

BriefGPT - AI 论文速递 ·

基于Transformer的方法在人物与物体的交互检测任务中取得了进展，但忽略了人物、物体和交互之间的关系。研究者提出了人物与物体解耦网络（HODN）来明确建模交互关系，并在V-COCO和HICO-Det数据集上取得了竞争性的性能。该方法可以与现有方法结合以获得最新的结果。

BriefGPT - AI 论文速递 ·

通过可视化和实验研究改进了DETR框架在人物-物体交互研究中的问题，增强了图像特征，改进了模型的谓词视觉上下文。在HICO-DET和V-COCO基准上超过了最先进的方法，同时保持了较低的训练成本。

BriefGPT - AI 论文速递 ·