本文介绍了RenderDiffusion,这是首个用于3D生成和推断的扩散模型,利用单眼2D监督进行训练。该模型在多个数据集上表现出色,能够生成3D场景并从2D图像推理3D场景。此外,DiffPose框架和DiT-3D模型显著提升了3D姿态估计和形状生成的效果。DiffHuman通过单一RGB图像实现逼真的3D人体重建,展示了扩散模型在3D生成领域的潜力。
本文介绍了一种基于三维高斯模型的人体重建方法,结合几何先验和注意机制,实现高效的细节恢复和新视图合成。该方法在多个数据集上表现优异,具备实时渲染能力,克服了传统技术的局限性。
该论文提出了一种名为GEA的新方法,利用3D高斯模型实现高保真度的人体和手部重建。其主要贡献包括通过两阶段姿势估计获取准确的SMPL-X姿势,以及采用迭代初始化策略解决高斯表示中的不平衡问题。该方法在新视图合成和人体姿势控制方面表现优异,验证了其有效性。
本文提出了一个新的框架,用于从野外视频中重建人体和场景,并在单个视频上提供新的人体姿势和视角渲染的方法。通过训练两个 NeRF 模型(human 和 scene),并依赖现有方法估计人体和场景的大致几何形状,可以从观察空间创建到无关姿态的规范空间的偏移场,进而在规范空间中训练人体模型。我们的方法能够从仅 10 秒的视频剪辑中学习特定主题的细节,包括服装褶皱和配件,并提供在新视角和新姿势下人体的高质量渲染和背景。
完成下面两步后,将自动完成登录并继续当前操作。