流媒体视频中的自监督式多角色社交活动理解

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

这项研究提出了一种基于多演员预测学习的自监督方法,用于流媒体视频中的社交活动识别。通过使用视觉语义图结构,对社交互动进行建模,实现了关系推理,具有鲁棒性表现。该方法在群体活动识别基准上取得了竞争性的性能,并可泛化到任意动作定位。

🎯

关键要点

  • 提出了一种基于多演员预测学习的自监督方法,用于流媒体视频中的社交活动识别。
  • 使用视觉语义图结构对社交互动进行建模,实现关系推理。
  • 该方法在最少标记数据的情况下表现出鲁棒性。
  • 在标准群体活动识别基准上取得了竞争性的性能。
  • 通过三个公开可用的动作定位基准评估,证明了其可泛化到任意动作定位的能力。
➡️

继续阅读