本文探讨了通过学习长期运动嵌入来高效生成运动的技术。研究表明,利用大规模轨迹获得的运动嵌入,可以更有效地生成长时间的真实运动,以满足文本提示或空间指令的目标。通过压缩运动嵌入并训练条件流匹配模型,生成的运动分布优于现有视频模型和特定任务方法。
MoConVQ是一个基于物理的运动控制框架,利用离散表示实现高效的运动表征。通过学习运动嵌入,展示其对各种应用的多样性和鲁棒性,包括通用跟踪控制、交互式角色控制、基于物理的运动生成以及与大型语言模型的无缝集成。
完成下面两步后,将自动完成登录并继续当前操作。