生成层次时间变换器用于手势动作识别和运动预测
原文约200字/词,阅读约需1分钟。发表于: 。提出一种新颖的框架,同时处理手势识别和 3D 未来手势预测,借助生成式 Transformer VAE 架构来联合捕捉两个方面,从而实现通过利用时间戳间观察到的短期手势和长期动作一致性,促进现实动作预测,确保手势姿势和动作的语义依赖和不同时间粒度的忠实表示。
本文提出了一种使用三角棱镜循环神经网络模型的新的人体姿势预测方法,通过编码不同时间尺度的时间依赖性来捕获分层结构。实验证明该方法在数量和质量上优于基线和最先进的方法。