城市建筑师:带有布局先验的可操控的三维城市场景生成

💡 原文中文,约1500字,阅读约需4分钟。
📝

内容提要

本文介绍了多种基于3D扩散模型和图注意力网络的城市场景生成方法,如UrbanDiffusion、CityGen和CityDreamer。这些方法结合实际驾驶数据、图卷积网络和预训练模型,实现了高质量、可控的三维城市布局生成,展现了在智慧城市和城市规划中的应用潜力。

🎯

关键要点

  • UrbanDiffusion利用Bird's-Eye View地图条件生成具有几何和语义的城市场景,能够生成多样性的城市场景并扩展到任意规模。
  • 通过大型语言模型和图卷积网络提取图特征,结合IoU正则化损失,UrbanDiffusion在SG-FRONT数据集上取得了更好的三维场景合成效果。
  • CityGen是一种新颖的端到端框架,支持生成无限、多样且可控的三维城市布局,具有广泛的应用前景。
  • CityDreamer通过将建筑实例生成与背景对象分离,解决了生成3D城市的挑战,并通过OSM和GoogleEarth数据集增强布局和外观的真实性。
  • 研究提出使用部分图像和文本提示控制生成多模态条件下的3D场景,证明该方法在生成多领域3D场景方面的有效性。
  • SceneWiz3D通过混合的3D表示从文本合成高保真度3D场景,并使用粒子群优化技术配置场景布局,实现详细且视角一致的3D场景生成。

延伸问答

UrbanDiffusion是如何生成城市场景的?

UrbanDiffusion利用Bird's-Eye View地图条件生成具有几何和语义的城市场景,并通过实际驾驶数据训练,实现多样性和可扩展性。

CityGen的主要特点是什么?

CityGen是一种端到端框架,支持生成无限、多样且可控的三维城市布局,具有广泛的应用前景。

CityDreamer如何解决生成3D城市的挑战?

CityDreamer通过将建筑实例生成与背景对象分离为不同模块,增强了生成3D城市的布局和外观的真实性。

SceneWiz3D是如何生成高保真度3D场景的?

SceneWiz3D通过混合的3D表示从文本合成高保真度3D场景,并使用粒子群优化技术配置场景布局。

这些城市场景生成方法在智慧城市中有什么应用潜力?

这些方法在智慧城市和城市规划中具有广泛的应用潜力,能够支持高质量的城市布局设计和模拟。

如何通过多模态条件生成3D场景?

通过使用部分图像、顶视图布局信息和文本提示,结合预训练模型,可以在多模态条件下生成3D场景。

➡️

继续阅读