MMM运动生成模型通过将3D人体动作转化为潜空间中的离散标记序列,实现高保真和快速的动作生成。它使用条件掩码动画变换器来捕捉动作标记之间的依赖性,并与文本标记进行语义映射,支持细粒度文本描述的动作解码。MMM还支持动作编辑,通过掩码标记实现平滑过渡。实验显示,MMM在生成质量和速度上优于现有方法,并支持身体部位修改和动作插值等高级编辑功能。
KV Inversion是一种实现动作编辑并保留原始图像内容的方法,无需训练稳定弥散模型,也无需扫描大规模数据集进行训练。
完成下面两步后,将自动完成登录并继续当前操作。