非语言互动检测

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

该论文提出了三个用于生成图像中人类中心视觉线索的提示,并结合多人多视角生成丰富的人类中心视觉线索,用于人物-物体交互检测。实验证明了利用这些生成的人类中心视觉线索进行交互检测的有效性,并在两个广泛使用的数据集上展示了该模型优于现有最先进方法的结果。

🎯

关键要点

  • 提出了三个用于生成图像中人类中心视觉线索的提示。
  • 结合多人多视角生成丰富的人类中心视觉线索。
  • 这些视觉线索用于人物-物体交互检测。
  • 实验证明了生成的视觉线索在交互检测中的有效性。
  • 模型在两个广泛使用的数据集上优于现有最先进方法。
➡️

继续阅读