集合式变压器进行人 - 物互动检测

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文介绍了一种聚合Transformer的方法(AGER),用于人-物互动(HOI)检测。AGER通过动态聚类和文本引导相结合,实现了在单阶段、端到端方式中的灵活应用。在HICO-Det数据集上,AGER取得了36.75的mAP,达到了最新的性能水平。

🎯

关键要点

  • 提出了一种聚合Transformer方法(AGER)用于人-物互动检测。
  • AGER首次实现了基于Transformer的HOI检测器在单阶段、端到端方式中的灵活应用。
  • 通过动态聚类与文本引导相结合,AGER获取实例标记。
  • 在提取不同实例级线索方面,AGER表现出显著改进。
  • 在HICO-Det数据集上,AGER取得了36.75的mAP,达到了最新的性能水平。
➡️

继续阅读