FTMoMamba:基于频率和文本状态空间模型的运动生成

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文提出FTMoMamba框架,结合频率状态空间模型与文本状态空间模型,解决运动生成中频率信息被忽视的问题。实验结果表明,该框架在文本转运动生成任务中表现优异,明显优于现有方法。

🎯

关键要点

  • 提出FTMoMamba框架,解决运动生成中频率信息被忽视的问题。
  • FTMoMamba框架结合频率状态空间模型(FreqSSM)和文本状态空间模型(TextSSM)。
  • 框架通过分解序列的频率成分生成静态姿态和细致运动。
  • 文本特征编码确保生成的运动与文本描述一致。
  • 实验结果显示FTMoMamba在文本转运动生成任务中表现优异,最低FID为0.181,显著优于现有方法。
➡️

继续阅读