小红花·文摘

本研究提出了一种基于级联扩散的生成框架，用于文本驱动的人体动作合成。该框架利用了一种名为GUESS的策略，将人体姿态逐步抽象为多个粒度级别上的更粗糙的骨架，从而改善了跨模态动作合成任务。实验证明，GUESS优于现有方法。