具有场景上下文的多人人体三维运动预测
原文中文,约300字,阅读约需1分钟。发表于: 。本研究针对长期三维人体运动预测中的挑战,特别是如何从输入序列生成真实的人体运动。提出的场景感知社交变换器模型(SAST)结合了时间卷积编码-解码架构与变换器的瓶颈,有效融合运动和场景信息,实现了对人和物体之间复杂互动的建模。模型在“厨房中的人类”数据集上表现出更高的真实感和多样性,展示了该方法的有效性。
本研究提出了场景感知社交变换器模型(SAST),用于长期三维人体运动预测。该模型结合了时间卷积编码-解码架构与变换器的瓶颈,能够有效融合运动和场景信息,实现对人和物体之间复杂互动的建模。实验结果表明,模型在“厨房中的人类”数据集上表现出更高的真实感和多样性,证明了该方法的有效性。