BriefGPT - AI 论文速递 ·

城市建筑师：带有布局先验的可操控的三维城市场景生成

💡 原文中文，约1500字，阅读约需4分钟。

📝

内容提要

本文介绍了多种基于3D扩散模型和图注意力网络的城市场景生成方法，如UrbanDiffusion、CityGen和CityDreamer。这些方法结合实际驾驶数据、图卷积网络和预训练模型，实现了高质量、可控的三维城市布局生成，展现了在智慧城市和城市规划中的应用潜力。

🎯

关键要点

UrbanDiffusion利用Bird's-Eye View地图条件生成具有几何和语义的城市场景，能够生成多样性的城市场景并扩展到任意规模。
通过大型语言模型和图卷积网络提取图特征，结合IoU正则化损失，UrbanDiffusion在SG-FRONT数据集上取得了更好的三维场景合成效果。
CityGen是一种新颖的端到端框架，支持生成无限、多样且可控的三维城市布局，具有广泛的应用前景。
CityDreamer通过将建筑实例生成与背景对象分离，解决了生成3D城市的挑战，并通过OSM和GoogleEarth数据集增强布局和外观的真实性。
研究提出使用部分图像和文本提示控制生成多模态条件下的3D场景，证明该方法在生成多领域3D场景方面的有效性。
SceneWiz3D通过混合的3D表示从文本合成高保真度3D场景，并使用粒子群优化技术配置场景布局，实现详细且视角一致的3D场景生成。

❓

延伸问答

UrbanDiffusion是如何生成城市场景的？

UrbanDiffusion利用Bird's-Eye View地图条件生成具有几何和语义的城市场景，并通过实际驾驶数据训练，实现多样性和可扩展性。

CityGen的主要特点是什么？

CityGen是一种端到端框架，支持生成无限、多样且可控的三维城市布局，具有广泛的应用前景。

CityDreamer如何解决生成3D城市的挑战？

CityDreamer通过将建筑实例生成与背景对象分离为不同模块，增强了生成3D城市的布局和外观的真实性。

SceneWiz3D是如何生成高保真度3D场景的？

SceneWiz3D通过混合的3D表示从文本合成高保真度3D场景，并使用粒子群优化技术配置场景布局。

这些城市场景生成方法在智慧城市中有什么应用潜力？

这些方法在智慧城市和城市规划中具有广泛的应用潜力，能够支持高质量的城市布局设计和模拟。

如何通过多模态条件生成3D场景？

通过使用部分图像、顶视图布局信息和文本提示，结合预训练模型，可以在多模态条件下生成3D场景。

🏷️

标签

3D扩散模型图注意力网络城市场景生成城市规划布局智慧城市

➡️

继续阅读

视频问诊在互联网医院、医联体、药店场景的落地差异
视频问诊不是一个”装上就能用”的标准产品。在互联网医院、医联体和药店这三种典型的落地场景下，虽然底层用的都是视频通话技术，但系统架构、集成深度、功能侧重和合...
Presentation: From Copy-Paste to Composition: Building Agents Like Real Software
Jake Mannix discusses moving AI agents past chaotic "1970s BASIC" arc...
I made a policy engine think it was in production
Kyverno is a Kubernetes-native policy engine that validates, mutates, and gen...
Meta made its own AI detection system. It should have just used Google’s
IIn March, Meta's Oversight Board called on the company to "meet its ...
The 2026 Honda Prelude is a marvel of hybrid technology
When it comes to enthusiast-geared Honda hardware, the Civic Si, Civic Type R...
AWS Billing Bug Shows Customers Trillion-Dollar Estimates While Its Own Cost Alarms Fail to Act
A configuration change in AWS's bill computation system showed customers ...