骨架感知潜在扩散模型用于文本驱动的运动生成与编辑
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本研究提出了一种骨架感知潜在扩散模型(SALAD),旨在解决文本驱动运动生成中关节、时间帧和文本表示的简化问题,从而显著提高文本与运动的对齐能力。
🎯
关键要点
- 本研究提出了一种骨架感知潜在扩散模型(SALAD)。
- 该模型旨在解决文本驱动运动生成中关节、时间帧和文本表示的简化问题。
- 简化表示限制了信息捕捉的能力。
- SALAD能够有效捕捉关节、帧与文本之间的复杂关系。
- 该模型通过跨注意力图实现基于文本的运动编辑,无需额外用户输入。
- SALAD在文本与运动对齐方面显著优于以往方法。
- 该方法具有广泛的编辑能力。
➡️