本研究提出了StyleMotif模型,解决了运动生成和风格转移的局限。该模型通过风格-内容交叉融合机制,实现了多模态运动生成,能够准确捕捉参考风格并保留现实感,实验结果表明其在风格化运动生成方面优于现有技术。
本研究提出了一种骨架感知潜在扩散模型(SALAD),旨在解决文本驱动运动生成中关节、时间帧和文本表示的简化问题,从而显著提高文本与运动的对齐能力。
本研究提出复合感知语义注入机制(CASIM),有效利用文本信息生成运动,显著提升运动的质量和可控性,尤其在控制精度和泛化能力方面表现突出。
本研究提出RMD基线,利用检索增强技术提升运动生成的泛化能力,有效解决数据集多样性和规模的限制,尤其在处理分布外数据时表现突出。
本文提出FTMoMamba框架,结合频率状态空间模型与文本状态空间模型,解决运动生成中频率信息被忽视的问题。实验结果表明,该框架在文本转运动生成任务中表现优异,明显优于现有方法。
本研究提出了一种全映射的方法,解决了文本到运动生成中的开放词汇问题,通过引入原子运动和文本分解,显著提升了运动生成的泛化能力。
本研究提出了一种基于注意机制的运动扩散模型MotionCLR,解决了现有模型在字级文本与运动对应关系上的不足,实验结果表明该方法具有良好的生成、编辑能力和可解释性。
这项研究介绍了一种名为《无限运动》的突破性工作,利用长文本扩展运动生成,成功弥合了短和长时间运动合成之间的差距。实验结果表明,该模型在生成长序列动作时表现出更优越的性能。
该研究提出了一种新的文本驱动的整体运动生成任务,使用HumanTOMATO文本对齐全身运动生成框架解决了以往的限制,并在实验证明中表现出显著优势。
完成下面两步后,将自动完成登录并继续当前操作。