从类别到风景:一个用于视频中多人人物 - 物体交互识别的端到端框架

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

提出了一种新的端到端类到场景框架 (CATS),通过生成几何特征和视觉特征融合构建场景交互图,学习人与物体类别关系。在两个关键的人物-物体交互基准测试中展示了最先进的性能。

🎯

关键要点

  • 提出了一种新的端到端类到场景框架 (CATS)
  • 通过生成几何特征和视觉特征融合构建场景交互图
  • 学习人与物体类别之间的关系
  • 在两个关键的人物-物体交互基准测试中展示了最先进的性能
➡️

继续阅读