震撼!AI实时生成游戏,每秒20帧输出,DeepMind扩散模型最新突破一夜爆火
💡
原文中文,约2900字,阅读约需7分钟。
📝
内容提要
GameNGen是谷歌DeepMind开发的首个完全AI驱动的实时游戏引擎,能以每秒20帧模拟DOOM。该引擎使用扩散模型进行训练,实时生成高质量且难以察觉的游戏画面。实验表明,人类难以区分模拟画面和真实游戏画面。
🎯
关键要点
- GameNGen是谷歌DeepMind开发的首个完全AI驱动的实时游戏引擎。
- 该引擎能够以每秒20帧的速度模拟经典游戏DOOM。
- 所有游戏画面根据玩家操作实时生成,门后的内容在玩家走进之前并不存在。
- GameNGen使用扩散模型进行训练,生成的画面质量高,难以与真实画面区分。
- 训练过程分为两个阶段,首先训练强化学习Agent记录游戏行为,然后使用这些数据进行模型训练。
- 模型通过添加高斯噪声来解决自回归生成中的误差累积问题。
- GameNGen在TPU-v5硬件上运行,能够实现实时交互式游戏体验。
- 实验表明,人类评估者几乎无法区分AI生成的画面与真实游戏画面。
- 研究者使用LPIPS和PSNR等方法评估图像质量,结果显示GameNGen在视觉质量上表现良好。
- 尽管有好评,但也有人认为称其为“游戏引擎”不太妥当,应该称为“渲染引擎”。
- 未来,消费者可能会体验到从文本直接创造游戏或虚拟世界的新方式。
➡️