通过优化参数在图卷积网络和变压器架构中整合特征以识别人类活动
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
本文提出了一种基于RGB-D视频的深度模型,用于自动活动识别。该模型使用3D卷积和最大池化算子,结合激活函数和学习出的时间结构。它可以直接对原始输入进行活动分类,并动态调整模型结构以适应人类活动的时间变化。该方法在挑战性场景下验证了其优越性,并提供了一个大型的RGB-D视频人类活动数据库。
🎯
关键要点
-
提出了一种基于RGB-D视频的自动活动识别的深度模型。
-
模型使用3D卷积和最大池化算子,结合激活函数和学习出的时间结构。
-
可以直接对原始输入进行活动分类。
-
允许动态调整模型结构以适应人类活动的时间变化。
-
在挑战性场景下验证了该方法的优越性。
-
提供了一个大型的RGB-D视频人类活动数据库。
➡️