城市建筑师:带有布局先验的可操控的三维城市场景生成
原文中文,约300字,阅读约需1分钟。发表于: 。通过引入一种组合式 3D 布局表示方法到文本转 3D 范式中的本文,克服了在大规模城市范围内扩展这一方法的局限性,并且成功地将文本转 3D 技术应用于覆盖超过 1000m 行驶距离的大尺度城市场景,同时展示了可调控城市场景生成的强大能力。
本文介绍了一种通过大型预训练的文本到图像模型实现对三维场景进行解缠的方法。通过重新排列具有空间先验的三维场景的部分,可以发现物体的存在,并且这些重排后的场景仍然是原场景的有效配置。通过联合优化多个 NeRFs,每个 NeRF 代表一个物体,以及一组将这些物体合成为场景的布局,成功地生成了分解为个体物体的三维场景。