计划、姿势与前行:走向开放世界的文本转动作生成
发表于: 。该研究提出了名为 PRO-Motion 的拆分与解决框架,由运动规划器、姿势扩散器和动作扩散器三个模块组成,通过指示大型语言模型生成描述目标动作关键姿势的脚本序列,转化为真实的运动,从而实现了从复杂的开放世界提示生成多样且逼真的运动。
该研究提出了名为 PRO-Motion 的拆分与解决框架,由运动规划器、姿势扩散器和动作扩散器三个模块组成,通过指示大型语言模型生成描述目标动作关键姿势的脚本序列,转化为真实的运动,从而实现了从复杂的开放世界提示生成多样且逼真的运动。