MoEmo 视觉变换器:在 HRI 情感检测中整合交叉注意力和运动向量的 3D 姿势估计
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
该文介绍了一种名为HuMoR的3D人体运动模型,可以鲁棒地估计时间姿态和形状。该模型是一个表达能力强的条件变分自编码器生成模型,可以从模糊的观察中推断出合理的姿态和形状。经过广泛的评估,证明该模型可以推广到多样化的动作和身体形状,并且可以从多种输入模态重建运动。
🎯
关键要点
- 引入了HuMoR:一种用于鲁棒估计时间姿态和形状的3D人体运动模型。
- 该模型是一个表达能力强的条件变分自编码器生成模型,学习运动序列每一步姿态变化的分布。
- 通过灵活的优化方法,HuMoR可以从模糊的观察中鲁棒地估计出合理的姿态和形状。
- 经过广泛评估,模型在大量运动捕捉数据集上训练后,可以推广到多样化的动作和身体形状。
- HuMoR能够从多种输入模态(包括3D关键点和RGB(-D)视频)重建运动。
➡️