OpenAI Sora真的有自己的物理模型吗?
原文中文,约1400字,阅读约需4分钟。发表于: 。关于 OpenAI 的视频生成模型 Sora 是否具有 "物理引擎"(OAI 自己声称具有 "世界模拟 "功能),有很多猜测。就像关于 LLM 中世界模型的争论一样,这个问题既非常有趣,又有些定义不清。当然,Sora 在推理过程中向 UE5 等外部物理引擎调用函数的可能性很小。请注意,LLM...
关于OpenAI的视频生成模型Sora是否具有物理引擎功能存在争议。Sora是一个扩散模型,以ViT为骨干,可以解码场景几何、光照、阴影和深度等信息。然而,该模型无法捕捉到自然图像结构的某些方面,例如正确的投影几何。需要进行干预性研究,以解码和操纵模型中直观物理特性的内部表征。需要超越行为证据来解决这类争论,并更具体地说明'世界模拟'的含义。