结构化人中心情境理解的情境场景图
原文中文,约2200字,阅读约需6分钟。发表于: 。本文针对现有图基方法在视频理解中忽视行动组件细粒度语义特性的不足,提出了一种新的图表示方法——情境场景图(SSG)。该方法同时编码人-物关系及相应的语义属性,通过多阶段的Interactive and Complementary Network(InComNet)进行情境场景图生成。实验结果表明,该表示在预测分类和推理任务中均表现优异,推动了人中心情境理解的发展。
本文提出了一种新的情境场景图(SSG)方法,解决了现有图基方法在视频理解中对行动组件细粒度语义特性的忽视。通过多阶段的互动与互补网络(InComNet)生成SSG,实验结果表明该方法在分类和推理任务中表现优异,推动了人中心情境理解的发展。