运动流动基元用于语言引导的轨迹生成
原文中文,约300字,阅读约需1分钟。发表于: 。本文提出了一种文本驱动的轨迹生成模型,通过使用少量演示轨迹数据,在低维度的运动流形的潜在坐标空间中应用具有平滑运动和鲁棒性的正则化项,利用最新的流动模型来捕捉复杂的条件分布,以解决样本规模小、轨迹空间高维度和复杂的文本条件分布的挑战,实验证明该模型在生成广泛文本输入对应的定性不同的运动方面明显优于现有方法。
本文介绍了一种优先级中心的M2DM模型,利用基于Transformer的VQ-VAE得出简洁的动作表示。该模型在保真度和多样性方面超过现有技术,尤其适用于复杂的文本描述。