HexaGen3D:稳定扩散仅一步之遥,实现快速和多样化的文字到 3D 生成
原文中文,约500字,阅读约需2分钟。发表于: 。使用预训练的 2D 扩散模型,HexaGen3D 有效地从文本提示中生成高质量的 3D 资产,并展示出对新对象或组合的强大推广能力。
本文介绍了PI3D框架,利用预训练的文本到图像扩散模型在几分钟内生成高质量的3D形状。PI3D具备了3D生成能力和2D模型的泛化能力,并通过分数蒸馏抽样提高3D形状的质量。PI3D实现了从图像到三视图生成的迁移,并通过混合训练伪图像和真实图像提高泛化能力。PI3D能够在几秒钟内采样多样性的3D模型,并在几分钟内改进。实验结果证实了PI3D在快速生成一致且高质量的3D模型方面的优势。建议PI3D是文本到3D生成领域的有前景的进展。