小红花·文摘

本文介绍了一种基于扩散模型的文本驱动运动生成框架MotionDiffuse，能够生成复杂的人类运动。该模型通过优先级中心的运动分散扩散模型（M2DM）和细粒度控制方法，在多个数据集上表现优越，尤其在处理复杂文本描述时。此外，研究提出了基于马尔可夫决策过程的算法InstructMotion，优化了文本与动作的对齐，提升了生成效果。