本文探讨基于文本描述的3D人体动作生成,提出了多角度注意机制和运动令牌方法,结合姿态估计和Motion Transformer模型,显著提升了运动检索和生成的性能。实验证明该方法在多个基准测试中优于现有技术。
完成下面两步后,将自动完成登录并继续当前操作。