量子位 ·

10秒创造一个世界！吴佳俊团队新作实时交互式3D世界生成

💡 原文中文，约2100字，阅读约需5分钟。

📝

内容提要

斯坦福吴佳俊团队与MIT合作开发的WonderWorld，能够在10秒内实时生成3D场景，速度比现有方法快近100倍。用户只需上传一张图片，即可交互生成无限扩展的虚拟世界，支持多种场景和视觉风格，显著提升了交互式3D生成的可能性。

🎯

🔎

WonderWorld的核心在于其FLAGS场景表示方法，使得3D场景生成速度大幅提升。这一技术突破不仅提高了生成效率，还解决了传统方法中存在的几何裂缝问题，展示了AI在实时交互式3D生成领域的巨大潜力。

用户只需上传一张图片，WonderWorld便能根据用户的实时输入生成不同的场景。这种交互性使得用户在虚拟世界中的探索更加个性化，拓宽了游戏和虚拟现实应用的边界。

与以往需要数十分钟甚至数小时的生成方法相比，WonderWorld的10秒生成时间显著提升了用户体验。这一优势使得WonderWorld在交互式3D生成领域具有明显的竞争力，可能会引领未来的技术发展方向。

❓

WonderWorld使用FLAGS场景表示方法，能够在10秒内生成3D场景，速度比现有方法快近100倍。

用户只需上传一张图片，并通过移动视角和输入文本提示来实时决定探索的方向和场景内容。

WonderWorld解决了3D场景之间的几何裂缝问题，提出了Guided depth diffusion方法来确保新旧场景在连接处的深度一致。

WonderWorld在生成速度和用户交互性上明显优于其他方法，且在用户偏好评估中也更受青睐。

WonderWorld能够生成多种场景类型，包括魔幻森林、现实都市和宁静乡村等，支持不同视觉风格。

WonderWorld由斯坦福吴佳俊团队与MIT合作开发，主要作者包括斯坦福大学的博士生和助理教授。

🏷️