震撼!AI实时生成游戏,每秒20帧输出,DeepMind扩散模型最新突破一夜爆火

💡 原文中文,约2900字,阅读约需7分钟。
📝

内容提要

GameNGen是谷歌DeepMind开发的首个完全AI驱动的实时游戏引擎,能以每秒20帧模拟DOOM。该引擎使用扩散模型进行训练,实时生成高质量且难以察觉的游戏画面。实验表明,人类难以区分模拟画面和真实游戏画面。

🎯

关键要点

  • GameNGen是谷歌DeepMind开发的首个完全AI驱动的实时游戏引擎。
  • 该引擎能够以每秒20帧的速度模拟经典游戏DOOM。
  • 所有游戏画面根据玩家操作实时生成,门后的内容在玩家走进之前并不存在。
  • GameNGen使用扩散模型进行训练,生成的画面质量高,难以与真实画面区分。
  • 训练过程分为两个阶段,首先训练强化学习Agent记录游戏行为,然后使用这些数据进行模型训练。
  • 模型通过添加高斯噪声来解决自回归生成中的误差累积问题。
  • GameNGen在TPU-v5硬件上运行,能够实现实时交互式游戏体验。
  • 实验表明,人类评估者几乎无法区分AI生成的画面与真实游戏画面。
  • 研究者使用LPIPS和PSNR等方法评估图像质量,结果显示GameNGen在视觉质量上表现良好。
  • 尽管有好评,但也有人认为称其为“游戏引擎”不太妥当,应该称为“渲染引擎”。
  • 未来,消费者可能会体验到从文本直接创造游戏或虚拟世界的新方式。
➡️

继续阅读