结构之法 算法之道

结构之法 算法之道 -

Google发布Genie硬杠Sora:通过大量无监督视频训练最终生成可交互虚拟世界

Sora 问世才不到两个星期,谷歌的世界模型也来了,能力看似更强大(嗯,看似):它生成的虚拟世界自主可控。

谷歌推出了基于互联网视频训练的生成式交互环境模型Genie。Genie能够学习细粒度的控制,生成动态交互环境。它由潜在动作模型、视频分词器和动态模型组成。Genie的架构采用了内存高效的ST-transformer,能够在长时间交互视频生成中更加高效。Genie的三个关键组件分别是潜在动作模型、视频分词器和动态模型。谷歌的研究科学家石宇歌是论文的共同一作。

google sora

相关推荐 去reddit讨论

热榜 Top10

eolink
eolink
观测云
观测云
LigaAI
LigaAI
Dify.AI
Dify.AI

推荐或自荐