流媒体视频中的自监督式多角色社交活动理解
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
这项研究提出了一种基于多演员预测学习的自监督方法,用于流媒体视频中的社交活动识别。通过使用视觉语义图结构,对社交互动进行建模,实现了关系推理,具有鲁棒性表现。该方法在群体活动识别基准上取得了竞争性的性能,并可泛化到任意动作定位。
🎯
关键要点
- 提出了一种基于多演员预测学习的自监督方法,用于流媒体视频中的社交活动识别。
- 使用视觉语义图结构对社交互动进行建模,实现关系推理。
- 该方法在最少标记数据的情况下表现出鲁棒性。
- 在标准群体活动识别基准上取得了竞争性的性能。
- 通过三个公开可用的动作定位基准评估,证明了其可泛化到任意动作定位的能力。
➡️