阿里巴巴的ABot-PhysWorld模型在权威评测WorldArena中获得第一,展示了其对物理规律的深刻理解和长程动态预测能力。该模型能够准确预测物体在复杂交互中的运动轨迹,具有实际应用价值。
何恺明团队的GeoPT提出了一种新预训练范式,通过合成动力学将静态几何转化为动态空间,使模型能够在无标签数据上学习物理规律。该方法节省了20-60%的物理仿真数据,提高了训练效率和适应性,为物理仿真提供了新思路。
蚂蚁灵波开源了通用世界模型LingBot-World,支持长时间生成与交互,具备高一致性和记忆力。用户可通过自然语言实时改变场景,模型遵循物理规律,提升了交互性和实时性。这一开源对具身智能领域具有重要意义,并与LingBot-Depth和LingBot-VLA结合,形成完整的智能基础设施。
本研究提出了T2VPhysBench基准,用于评估文本到视频生成模型遵循物理规律的能力。结果显示,现有模型在遵循核心物理定律方面表现普遍较差,揭示了当前技术的局限性,并为未来研究指明了方向。
近年来,AI视频生成技术迅速发展,VBench-2.0评测体系强调视频的内在真实性,关注物理规律和常识推理等深层次能力,补充VBench-1.0,推动视频生成模型的创作与应用潜力提升。
南京理工大学研究团队提出的Thermo-Mesh Transformer Network (TMTN)能够在0.78秒内高效重构三维温度场,误差降低38%。该模型结合物理规律与人工智能,解决了传统方法计算耗时和效率低的问题,适用于复杂场景的实时温度预测。
AIxiv专栏报道了生成式“物理AI”的研究,探讨如何将物理规律融入视觉生成模型。文章介绍了六种显式物理模拟的生成范式,并分析了评估模型物理刻画能力的方法。未来,生成式“物理AI”有望在多个领域推动技术进步。
本研究提出Gravity-Bench-v1基准,旨在评估AI智能体在动态环境中发现隐藏物理规律的能力。该基准通过模拟引力动态,考察智能体的数据收集与科学概括能力,为AI科学发现提供评估框架。
视频生成模型如Sora能够生成符合常识的视频,但尚未掌握物理规律。研究表明,这些模型无法抽象出普遍的物理规则,在未见过的场景中表现不佳,主要依赖记忆和案例模仿。尽管增加数据和模型规模可以改善表现,但对新场景的推理能力提升有限。
字节跳动豆包大模型团队经过8个月的研究发现,视频生成模型能够记忆训练案例,但缺乏对物理规律的真正理解,无法泛化到新场景。尽管在熟悉概念下表现良好,模型仍依赖记忆,缺乏抽象能力。
我们提出了ACE(AI2 Climate Emulator),一个200M参数的自回归机器学习模拟器,用于全球大气模型。ACE能够准确评估物理规律并保持稳定。相比基准模型,ACE在80%以上的跟踪变量上表现更佳,且时间和资源效率更高。
本文讨论了世界模型和Sora之间的关系。世界模型是AI领域中描述智能体对环境的内部表示和模拟的概念。Sora被称为“世界模拟器”,但实际上更像是一个视频工具,而不是一个能够准确回答反事实推理问题的工具。文章指出Sora并没有准确学习到物理规律。作者认为简单地堆砌数据并不是通向更高级智能技术的道路。
ACE是一个自回归机器学习模拟器,用于全球大气模型,具有200M参数,可以评估物理规律。该模拟器在10年内保持稳定,并忠实地再现了参考模型的气候。墙钟时间比参考模型少100倍,使用常见资源效率更高100倍。
完成下面两步后,将自动完成登录并继续当前操作。