小红花·文摘

本文介绍了RenderDiffusion，这是首个用于3D生成和推断的扩散模型，利用单眼2D监督进行训练。该模型在多个数据集上表现出色，能够生成3D场景并从2D图像推理3D场景。此外，DiffPose框架和DiT-3D模型显著提升了3D姿态估计和形状生成的效果。DiffHuman通过单一RGB图像实现逼真的3D人体重建，展示了扩散模型在3D生成领域的潜力。

DiffSurf：一种基于变压器的扩散模型，用于生成和重建姿态下的3D表面

BriefGPT - AI 论文速递 ·

本文介绍了一种基于三维高斯模型的人体重建方法，结合几何先验和注意机制，实现高效的细节恢复和新视图合成。该方法在多个数据集上表现优异，具备实时渲染能力，克服了传统技术的局限性。

稀疏视图合成的普遍人类高斯函数

BriefGPT - AI 论文速递 ·

该论文提出了一种名为GEA的新方法，利用3D高斯模型实现高保真度的人体和手部重建。其主要贡献包括通过两阶段姿势估计获取准确的SMPL-X姿势，以及采用迭代初始化策略解决高斯表示中的不平衡问题。该方法在新视图合成和人体姿势控制方面表现优异，验证了其有效性。

本文提出了一个新的框架，用于从野外视频中重建人体和场景，并在单个视频上提供新的人体姿势和视角渲染的方法。通过训练两个 NeRF 模型（human 和 scene），并依赖现有方法估计人体和场景的大致几何形状，可以从观察空间创建到无关姿态的规范空间的偏移场，进而在规范空间中训练人体模型。我们的方法能够从仅 10 秒的视频剪辑中学习特定主题的细节，包括服装褶皱和配件，并提供在新视角和新姿势下人体的高质量渲染和背景。

基于视频的姿势调节化身

BriefGPT - AI 论文速递 ·

DiffSurf：一种基于变压器的扩散模型，用于生成和重建姿态下的3D表面

稀疏视图合成的普遍人类高斯函数

从单目 RGB 视频生成富有表达力的高斯人类虚拟形象

基于视频的姿势调节化身