小红花·文摘

本研究提出了一种场景感知社交变换器模型(SAST)，用于长期三维人体运动预测。该模型结合时间卷积和变换器架构，有效融合运动与场景信息，提升了人和物体之间复杂互动的建模能力。在“厨房中的人类”数据集上，模型展现了更高的真实感和多样性，验证了其有效性。