ICML 2024|复杂组合3D场景生成,LLMs对话式3D可控生成编辑框架来了
原文中文,约3100字,阅读约需8分钟。发表于: 。北京大学的VDIG实验室与合作者发布了GALA3D,一个高质量的Text-to-3D复杂场景生成与可控编辑框架。GALA3D能够生成具有多物体和复杂交互关系的三维场景,并支持对话式交互的可控编辑。该研究在生成场景质量、多物体复杂交互、场景几何一致性等方面表现出卓越性能,并超越了现有的文生3D场景方法。
北京大学的VDIG实验室与合作者发布了GALA3D,一个高质量的Text-to-3D复杂场景生成与可控编辑框架。GALA3D能够生成具有多物体和复杂交互关系的三维场景,并支持对话式交互的可控编辑。该研究在生成场景质量、多物体复杂交互、场景几何一致性等方面表现出卓越性能,并超越了现有的文生3D场景方法。