一种视频动作检测的语法组合模型
原文中文,约300字,阅读约需1分钟。发表于: 。基于语法组合模型的行为检测方法可以有效地分析视频中的人类行动,提高模型的解释性和优化效果。
本文提出了Action Graph结构实现多协调时间动作相关视频生成,AG2Vid模型分离运动和外观特征,经CATER和Something-Something V2数据集训练和评估,生成视频视觉质量和语义一致性更好,具有零样本能力。
基于语法组合模型的行为检测方法可以有效地分析视频中的人类行动,提高模型的解释性和优化效果。
本文提出了Action Graph结构实现多协调时间动作相关视频生成,AG2Vid模型分离运动和外观特征,经CATER和Something-Something V2数据集训练和评估,生成视频视觉质量和语义一致性更好,具有零样本能力。