Instant3D是一种新颖的方法,通过两阶段的方式从文本提示中生成高质量、多样化的3D资产。它使用2D文本到图像扩散模型生成稀疏一致的四个结构化视图,然后利用基于Transformer的稀疏视图重构器回归生成的图像的NeRF。实验证明,Instant3D可以在20秒内生成高质量、多样化且无Janus问题的3D资产,比之前的基于优化的方法快两个数量级。
Instant3D是一种新颖的方法,通过两阶段的方式从文本提示中生成高质量、多样化的3D资产。
最新的大规模文本到图像扩散模型在文本到三维生成领域取得了突破,能够通过给定的文本提示和手绘草图创作准确忠实的三维场景。通过改进的条件扩散模型和预训练的照片到草图模型,实现了更好的可控性和对齐效果。实验证明该模型能够生成与输入的文本提示和草图紧密对齐的三维场景。
Instant3D提出了一种从文本提示生成3D资产的新方法,通过两阶段生成高质量图像,仅需20秒,远快于传统需1-10小时的方法。
完成下面两步后,将自动完成登录并继续当前操作。