机器之心 ·

谷歌世界模型爆发：单张图生成可玩3D世界，还要和马斯克一起做AI游戏

💡 原文中文，约4500字，阅读约需11分钟。

📝

内容提要

Google DeepMind发布了新一代世界模型Genie 2，能够根据单张图像生成无限3D环境，供人类或AI智能体游玩。这项技术被认为是视频游戏的未来，吸引了马斯克的关注。Genie 2在多样化3D世界生成方面取得了重大突破，支持快速原型设计和智能体训练，展示了基础世界模型的潜力。

🎯

🔎

Genie 2基于自回归潜在扩散模型，能够根据单张图像生成丰富的3D环境。这种技术使得AI智能体可以在多样化的场景中进行训练，填补了以往训练环境单一的瓶颈。与传统模型相比，Genie 2在生成复杂角色动画和物体交互方面展现了更强的能力，推动了AI在游戏领域的应用。

与李飞飞的World Labs相比，Genie 2在生成3D场景时采用了不同的技术路径。Genie 2侧重于视频扩散和像素预测，而World Labs则更注重物理世界的建模。这种技术上的差异可能影响到生成环境的真实感和互动性，值得关注不同模型在实际应用中的表现。

Genie 2的发布不仅为游戏开发带来了新的可能性，也为AI智能体的训练提供了丰富的环境。随着技术的不断完善，未来可能会出现更多基于Genie 2的应用场景，如虚拟现实和增强现实中的交互体验。这将为研究人员和开发者提供更广阔的创作空间。

❓

Genie 2是Google DeepMind发布的新一代世界模型，能够根据单张图像生成无限3D环境供人类或AI智能体游玩。

Genie 2被认为是视频游戏的未来，因为它能够生成多样化的3D环境，支持快速原型设计和智能体训练。

Genie 2与World Labs的本质区别在于，Genie 2基于视频扩散模型生成3D场景，而World Labs更侧重于物理本质的建模。

Genie 2基于自回归潜在扩散模型，使用大型视频数据集进行训练，以生成多样化的3D环境。

Genie 2能够生成丰富多样的训练环境，帮助研究人员快速试验新环境，从而训练和评估具身AI智能体。

Genie 2具备物体交互、复杂角色动画、物理效果等多种涌现能力，能够模拟虚拟世界中的各种动作后果。

🏷️