本研究探讨视频生成模型是否能通过视觉数据发现遵循物理法则的世界模型。通过二维运动与碰撞模拟测试,发现模型在同分布下表现良好,但在不同分布场景下泛化能力不足,主要依赖实例泛化,表明模型无法揭示基本物理法则。
完成下面两步后,将自动完成登录并继续当前操作。