本文介绍了一种基于扩散模型的文本驱动运动生成框架MotionDiffuse,能够生成复杂的人类运动。该模型通过优先级中心的运动分散扩散模型(M2DM)和细粒度控制方法,在多个数据集上表现优越,尤其在处理复杂文本描述时。此外,研究提出了基于马尔可夫决策过程的算法InstructMotion,优化了文本与动作的对齐,提升了生成效果。
完成下面两步后,将自动完成登录并继续当前操作。