北京大学的VDIG实验室与合作者发布了GALA3D,一个高质量的Text-to-3D复杂场景生成与可控编辑框架。GALA3D能够生成具有多物体和复杂交互关系的三维场景,并支持对话式交互的可控编辑。该研究在生成场景质量、多物体复杂交互、场景几何一致性等方面表现出卓越性能,并超越了现有的文生3D场景方法。
GALA3D是一种生成式3D高斯模型,用于文本到3D生成。它使用大型语言模型生成初始布局,并引入布局引导的3D高斯表示。通过条件扩散的对象场景组合优化机制,生成具有一致几何、纹理和比例的真实3D场景。GALA3D是一个用户友好的框架,可用于场景级3D内容生成和编辑。
完成下面两步后,将自动完成登录并继续当前操作。