小红花·文摘

本文探讨了基于VQ-VAE和GPT的人体运动生成框架，提出了InterGen、CHOIS和HOI-DM等方法，以提高生成质量和多样性。研究表明，通过文本指令生成逼真的人-物互动动作，显著改善了在机器人、游戏和动画等领域的应用效果。

COLLAGE：基于分层潜在扩散与语言模型的人机协作交互生成

BriefGPT - AI 论文速递 ·

本文综述了人体运动生成领域的研究进展，探讨了基于文本、音频和场景条件的多种生成模型及方法，展示了不同模型的有效性和实际应用潜力，并提出了未来研究方向。

MoGenTS：基于时空联合建模的动作生成

BriefGPT - AI 论文速递 ·

本文介绍了人体运动生成领域的最新研究进展，重点讨论了基于扩散模型的生成框架，如Motion Diffusion Model和VLOGGER，及其在生成高质量舞蹈视频和复杂运动中的应用潜力。同时，探讨了评估指标、数据集及未来研究方向。

ViMo：从休闲视频生成动作

BriefGPT - AI 论文速递 ·

本文探讨了VideoMAE在自主监督视频预训练中的高效性，强调数据质量的重要性。研究提出了MVHumanNet数据集，包含4500个人的多视角行动序列，展示了在2D和3D视觉任务中的性能提升。此外，提出了一种新的人体运动生成模型，能够修复和生成完整的运动，从而提升视频行为识别性能。

HVM-1：使用接近 5000 小时类人视频数据预训练的大规模视频模型

BriefGPT - AI 论文速递 ·

本文介绍了细粒度文本运动数据集FineHumanML3D及其生成模型FineMotionDiffuse，旨在通过两级流模型有效生成3D动作。研究表明，该模型在生成质量上显著提升，尤其在文本到运动合成方面，提出了多种新方法和框架，如TEMOS和CATMO，推动了人体运动生成技术的发展，并探讨了未来研究方向。

从文本描述中生成三维场景的人类动作

BriefGPT - AI 论文速递 ·

本文研究了基于 VQ-VAE 和 GPT 的人体运动生成框架，提出了多种提升生成质量的方法，包括运动检索、文本生成评估和无监督学习。通过创新模型和数据集，展示了在复杂文本描述下生成高质量、丰富多样的3D动作序列的能力，尤其在 HumanML3D 和 KIT-ML 数据集上表现优异。

探索人类偏好的文本生成动作

BriefGPT - AI 论文速递 ·

本文介绍了HUMANISE数据集及其在人体运动生成中的应用，探讨了基于语言和场景的生成模型，以提高人体动作的自然性和多样性。文章回顾了相关研究、数据集和评估指标，并提出了未来的研究方向。

激光人：自由环境下基于语言引导的场景感知人体运动生成

BriefGPT - AI 论文速递 ·