机器之心 ·

ICLR 2025 Spotlight | 让城市「动」起来！DynamicCity突破4D大场景生成技术边界

💡 原文中文，约6700字，阅读约需16分钟。

📝

内容提要

DynamicCity是一个创新的4D场景生成框架，通过特征降维和扩散模型实现高质量动态场景生成，突破静态生成的局限。该项目由多所高校合作，支持可控生成，广泛应用于自动驾驶等领域。

🎯

🔎

DynamicCity的4D场景生成技术突破了传统静态生成的局限，能够更真实地模拟动态交通流和行人运动。这一进步对于自动驾驶等领域具有重要意义，因为它能够提供更为真实的训练和测试环境，提升智能系统的安全性和可靠性。

DynamicCity通过特征降维和扩散模型的结合，实现了高效的动态场景生成。这种技术不仅提升了生成质量和训练效率，还支持多种可控生成方式，未来可广泛应用于智能交通、城市规划等多个领域，推动相关技术的发展。

尽管DynamicCity在动态场景生成上取得了显著进展，但仍需关注其在复杂场景下的生成质量和效率。尤其是在处理大规模动态场景时，如何保持生成的真实感和细节仍然是一个挑战，未来的研究需要进一步优化模型以应对这些问题。

❓

DynamicCity的主要创新点在于通过特征降维和扩散模型实现高质量的4D动态场景生成，突破了静态生成的局限。

DynamicCity支持多种可控生成方式，包括轨迹引导生成、指令驱动生成和4D场景修改等功能。

DynamicCity的核心技术包括HexPlane特征表示、变分自编码器（VAE）和扩散模型（DiT），实现了高效的4D场景生成。

DynamicCity在生成质量、训练速度和内存消耗上取得了显著提升，尤其是通过Expansion & Squeeze Strategy降低了内存消耗70.84%。

DynamicCity广泛应用于自动驾驶等领域，能够为智能系统的训练与验证提供虚拟试验场。

DynamicCity的研究团队包括上海人工智能实验室、卡耐基梅隆大学、新加坡国立大学和新加坡南洋理工大学。

🏷️