具有场景上下文的多人人体三维运动预测
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本研究提出了场景感知社交变换器模型(SAST),用于长期三维人体运动预测。该模型结合了时间卷积编码-解码架构与变换器的瓶颈,能够有效融合运动和场景信息,实现对人和物体之间复杂互动的建模。实验结果表明,模型在“厨房中的人类”数据集上表现出更高的真实感和多样性,证明了该方法的有效性。
🎯
关键要点
- 本研究提出了场景感知社交变换器模型(SAST)。
- 该模型用于长期三维人体运动预测,解决了生成真实人体运动的挑战。
- 模型结合了时间卷积编码-解码架构与变换器的瓶颈。
- 有效融合运动和场景信息,建模人和物体之间的复杂互动。
- 在“厨房中的人类”数据集上,模型表现出更高的真实感和多样性。
- 实验结果证明了该方法的有效性。
➡️