BriefGPT - AI 论文速递 ·

Recurrent Flow Diffusion for Human Motion Generation

💡 原文中文，约1400字，阅读约需4分钟。

📝

内容提要

本研究提出了基于扩散模型的动作生成框架ReMoDiffuse，通过结合检索机制改善去噪过程，提升文本驱动动作生成的多样性。相关模型如MoDiff、MotionDiffuse和CrossDiff在运动合成和预测方面表现优异，能够生成复杂的人类运动，适应实时命令，展现出强大的鲁棒性和生成质量。

🎯

❓

ReMoDiffuse框架结合了检索机制以改善去噪过程，提升了文本驱动动作生成的通用性和多样性。

MoDiff模型基于自回归概率扩散模型，结合跨模式Transformer编码器和基于Transformer的解码器，生成控制时序依赖性的动作。

CrossDiff模型的跨扩散机制允许将2D或3D噪声转化为清晰的运动，捕捉复杂人体运动细节，整合了3D和2D信息。

MotionDiffuse框架用于文本驱动运动生成，能够有效生成复杂和多种变化的人类运动。

DiffDance模型能够生成与输入音乐有效对齐的逼真舞蹈序列，结果与最先进的自回归方法相媲美。

这些模型在运动合成和预测方面表现优异，展现出强大的鲁棒性和生成质量。

🏷️