城市建筑师:带有布局先验的可操控的三维城市场景生成
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文介绍了一种通过大型预训练的文本到图像模型实现对三维场景进行解缠的方法。通过重新排列具有空间先验的三维场景的部分,可以发现物体的存在,并且这些重排后的场景仍然是原场景的有效配置。通过联合优化多个 NeRFs,每个 NeRF 代表一个物体,以及一组将这些物体合成为场景的布局,成功地生成了分解为个体物体的三维场景。
🎯
关键要点
-
介绍了一种通过大型预训练的文本到图像模型实现三维场景解缠的方法。
-
通过重新排列具有空间先验的三维场景部分,可以发现物体的存在。
-
重排后的场景仍然是原场景的有效配置。
-
方法从头开始联合优化多个 NeRFs,每个 NeRF 代表一个物体。
-
生成的场景符合图像生成器中的分布。
-
成功生成分解为个体物体的三维场景。
-
在文本到三维内容创建中实现了新的功能。
➡️