精确物理驱动的文本到 3D 生成
原文中文,约500字,阅读约需2分钟。发表于: 。Phy3DGen 是一种精确的、驱动物理的文本生成 3D 方法,通过分析生成的 3D 形状的固体力学,揭示了现有文本生成 3D 方法生成的 3D 形状在真实世界应用中不符合物理定律的问题,并利用 3D 扩散模型和一个数据驱动的可微分物理层来优化 3D 形状先验,同时实现几何的高效优化和学习 3D 形状的精确物理信息,实验结果表明我们的方法能够兼顾几何的合理性和精确的物理感知,进一步连接...
本文介绍了PI3D框架,利用预训练的文本到图像扩散模型在几分钟内生成高质量的3D形状。通过微调2D扩散模型为3D扩散模型,PI3D具备了3D生成能力和2D模型的泛化能力,并通过分数蒸馏抽样提高3D形状的质量。PI3D实现了从图像到三视图生成的迁移,并通过混合训练伪图像和真实图像提高泛化能力。PI3D能够在几秒钟内采样多样性的3D模型,并在几分钟内改进。实验结果证实了PI3D在快速生成一致且高质量的3D模型方面的优势。建议PI3D是文本到3D生成领域的一个有前景的进展。