本研究提出了一种方法,结合运动数据库和视觉语言模型,生成类人机器人自然且多样的全身运动,以提升其在真实环境中的表现,解决自然语言理解和人类行为表现不足的问题。
该研究提出了一种新的文本驱动的整体运动生成任务,使用HumanTOMATO文本对齐全身运动生成框架解决了以往的限制,并在实验证明中表现出显著优势。
完成下面两步后,将自动完成登录并继续当前操作。