李飞飞的World Labs与光轮智能合作,推动具身智能进入评测驱动时代。两者结合利用仿真技术和真实物理对齐的资产,提升机器人评测的可扩展性,解决行业评测难题。
李飞飞博士是斯坦福大学计算机科学系的红杉教授和人本人工智能研究所的共同创始人,曾任谷歌AI/ML首席科学家。她的成长经历从中国成都到美国新泽西,父母的支持激发了她的科学热情。她创建的ImageNet数据集推动了现代AI的发展,强调了大数据的重要性。目前,她在World Labs专注于空间智能,推动AI技术的应用与发展。
李飞飞博士是斯坦福大学计算机科学系的首任红杉教授,创立了人本人工智能研究所,并担任生成性AI公司World Labs的首席执行官。她曾在谷歌担任副总裁和首席科学家,拥有普林斯顿大学物理学学士和加州理工学院电气工程博士学位。她的回忆录《我所见的世界》被奥巴马推荐为AI书籍之一。
上海交通大学将于2025年增设具身智能本科专业,成为全球首个独立开设该专业的高校。该专业将结合人工智能和机械动力等多学科知识,培养复合型人才,预计每年招生30人,旨在填补人才缺口,推动中国具身智能产业发展。
寒武纪项目由谢赛宁、李飞飞和LeCun主导,推出了Cambrian-S模型,专注于提升AI的空间感知能力。该模型通过多模态视频理解,解决了传统模型在长视频处理中的不足,取得了显著进展。
2025 年春,李飞飞荣获「伊丽莎白女王工程奖」,以表彰其在计算机视觉与深度学习领域的奠基性贡献。作为 ImageNet 项目的核心推动者,她开创了数据驱动的视觉识别方法,也提出「以人为本」的 AI 理念,在硅谷的商业化浪潮中始终保持对 AI 伦理、社会价值与去人性化风险的警觉。然而,其少数派身份使她处于在科研成就与产业实践之间的微妙地带,引发持续讨论。
李飞飞的Marble、Lecun的JEPA和谷歌的Genie 3三种世界模型各具特色。Marble专注于生成可编辑的3D环境,JEPA关注机器人训练的因果结构,而Genie 3则生成可交互的视频环境。这三者在技术路径和应用上存在显著差异,形成了一个世界模型金字塔。
空间智能是人工智能的下一个前沿,李飞飞指出其核心能力包括生成、交互和多模态处理。通过构建世界模型,AI将更好地理解和创造现实与虚拟世界,推动各领域的创新与发展。
Marble是新发布的3D世界生成模型,支持文本和图片输入,用户可以生成完整的3D场景并进行深度编辑,提供多种导出格式。其多模态输入和编辑能力超越现有工具,降低了3D建模的门槛。李飞飞强调空间智能的重要性,Marble旨在让AI理解三维空间。
李飞飞在博客中指出,AI缺乏空间智能,无法准确理解物理世界。空间智能是人类智能的基础,影响创造力和科学发现。构建“世界模型”是实现AI空间智能的关键,需具备生成性、多模态性和交互性。未来,空间智能将推动创意、机器人和科学等领域的发展,提升人类能力。
李飞飞的实验室推出了RTFM技术,能够实时生成3D世界模型。与传统模型不同,RTFM可以从一张图片生成可交互场景,并且仅需一块H100 GPU高效运行。该技术通过学习大量视频数据,具备复杂的视觉效果和空间记忆,允许用户在生成的世界中持续互动。
李飞飞推出的新模型RTFM可在单张H100 GPU上实时运行,具备持久性和3D一致性。该模型采用自回归扩散变换器架构,能够从2D图像生成新视图,支持无限时长的交互,推动生成式世界建模的发展。
李飞飞发起的BEHAVIOR家务挑战赛正式启动,旨在推动机器人家务能力的发展。参赛者需使用星海图R1 Pro在虚拟家庭环境中完成50项家务任务,比赛分为标准赛道和特权赛道。李飞飞希望借鉴ImageNet的成功,推动具身智能的标准化与发展。
李飞飞团队推出了一种新型世界模型,用户只需一张图像即可生成可无限探索的3D世界。该模型支持多样风格和高质量几何结构,用户可以自由导航并导出高斯点云,生成的世界永久存在且完全免费。
李飞飞指出,大语言模型在理解物理世界方面存在局限,因其主要依赖一维语言信号,而物理世界是三维的。尽管模型能处理语言任务,但在空间智能和物理推理上表现不佳,无法真正理解物理现象。这引发了对模型结合物理与多模态理解的讨论。
李飞飞在访谈中指出,空间智能是实现通用人工智能(AGI)的关键,强调理解和生成三维世界是AI的基本问题。她希望构建超越平面像素的世界模型,并回顾了ImageNet的影响,讨论了AI的发展及其与自然语言的结合,展望未来的空间智能应用。
李飞飞的成功源于探索精神和独立思考。她在父母的引导下培养了对自然的好奇心和批判性思维。在经历逆境后,她在计算机视觉领域取得了突破,推动了人工智能的发展。她的教育理念强调保护孩子的独特性与探索精神,关注人文与科学的结合。
完成下面两步后,将自动完成登录并继续当前操作。