MeshFormer：利用3D引导重建模型生成高质量网格

本研究针对现有开世界3D重建模型在生成高质量网格时的不足之处，提出了一种新颖的MeshFormer模型。该模型通过结合3D稀疏体素、变换器和3D卷积，显著提升了三维结构的学习效率，最终能够高效生成具有精细几何细节的高质量网格。

本文介绍了一种直接的3D生成模型(Direct3D)，它可以从图像生成高质量的3D模型。该方法包括D3D-VAE和D3D-DiT，D3D-VAE将3D形状编码成潜在三平面空间，而D3D-DiT对潜在分布进行建模，实现了可扩展到大规模3D数据集的原生3D生成模型。实验证明，该模型具有更好的生成质量和泛化能力。

D3D-DiT D3D-VAE 原生3D生成模型直接的3D生成模型重建高质量的3D模型