本研究提出了一种基于级联扩散的生成框架,用于文本驱动的人体动作合成。该框架利用了一种名为GUESS的策略,将人体姿态逐步抽象为多个粒度级别上的更粗糙的骨架,从而改善了跨模态动作合成任务。实验证明,GUESS优于现有方法。
完成下面两步后,将自动完成登录并继续当前操作。