文本到动作的自主 LLM 增强对抗攻击

💡 原文中文,约500字,阅读约需2分钟。
📝

内容提要

该文章介绍了一种基于掩码动作模型的新颖的MMM运动生成范例,解决了实时性、高保真度和动作可编辑性之间的权衡,具有高质量动画生成和先进的编辑功能。实验结果表明,该模型在生成动画方面表现优于当前领先的方法,并且在速度上也有显著提升。

🎯

关键要点

  • MMM运动生成范例旨在解决实时性、高保真度和动作可编辑性之间的权衡。
  • MMM通过将3D人体动作转换为潜空间中的离散标记序列,实现高保真度和高速度的动作生成。
  • MMM具有固有的动作可编辑性,允许在需要编辑的位置放置掩码标记,自动填充空白部分。
  • 实验结果表明,MMM在生成高质量动画方面超过了当前领先的方法,FID得分分别为0.08和0.429。
  • MMM提供了先进的编辑功能,如身体部位修改、动作插值和长动作序列合成。
  • 与可编辑动作扩散模型相比,MMM在单个中档GPU上的速度提高了两个数量级。
➡️

继续阅读