Guide3D:根据文本和图像指导创建 3D 化身
原文中文,约300字,阅读约需1分钟。发表于: 。通过结合文字和图像信息,利用扩散模型,我们开发了一种零样本的三维生成模型,能够合成高分辨率纹理网格,实现了将二维图像直接转化为三维空间的功能。
DreamAvatar是一个生成高质量、可控制姿态的3D人类头像的框架,使用NeRF生成3D点密度和颜色特征,并通过文本到图像扩散模型提供2D自监督。通过SMPL模型提供粗略的姿势和形状指导生成,并通过双重空间设计将规范空间和观察空间联系起来。经过评估,DreamAvatar优于现有方法,为文本和形状引导的3D人体生成设立了新的技术水准。