DeepMind推出Genie 3,这是一个能够根据文本提示生成互动3D环境的框架。该系统实时渲染场景,支持物体持久性和一致的物理效果,适用于机器人和具身AI的训练,区别于其他生成AI系统。
本研究探讨了通用深度神经网络模型在自然视频中预测遮挡区域的物理理解。模型通过联合学习抽象表示,有效理解物体的持久性和形状一致性,经过一周训练后表现超越偶然,挑战传统观念。
完成下面两步后,将自动完成登录并继续当前操作。