本研究提出了一种场景感知社交变换器模型(SAST),用于长期三维人体运动预测。该模型结合时间卷积和变换器架构,有效融合运动与场景信息,提升了人和物体之间复杂互动的建模能力。在“厨房中的人类”数据集上,模型展现了更高的真实感和多样性,验证了其有效性。
完成下面两步后,将自动完成登录并继续当前操作。