量子位 ·

北京人形开源最新VLM模型，推动具身智能再迈关键一步 !

💡 原文中文，约3400字，阅读约需9分钟。

📝

内容提要

北京人形机器人创新中心于11月13日开源了具身智能VLM模型Pelican-VL 1.0，参数规模为7B和72B，性能超越GPT-5和Google Gemini，成为最强开源多模态大模型。该模型由女性团队主创，采用DPPO训练范式，提升了自我纠错能力，推动机器人在多场景中的应用。

🎯

关键要点

北京人形机器人创新中心于11月13日开源了Pelican-VL 1.0模型，参数规模为7B和72B。
Pelican-VL 1.0的性能超越GPT-5和Google Gemini，成为最强开源多模态大模型。
该模型由女性团队主创，体现了女性在科技研发中的重要贡献。
Pelican-VL采用DPPO训练范式，提升了自我纠错能力，数据量仅为其他大模型的1/10至1/50。
Pelican-VL 1.0能够提升具身智能在多种真实场景中的应用能力。
模型在1000+ A800 GPU集群上训练，单次检查点训练耗费超过50,000 A800 GPU-小时。
Pelican-VL通过模仿人类学习方式，不断自我纠错和迭代进步。
Pelican-VL在视觉-语言和具身任务上的能力显著提升，能够更准确理解图像和语言指令。
Pelican-VL作为VLA系统的认知前端，帮助机器人拆解复杂任务并执行。
北京人形的解法是让VLM和世界模型相互纠偏，提升机器人的决策能力。
Pelican-VL的开源为机器人厂商和开发者提供了良好的土壤，加速研发进程。
Pelican-VL的开放性和多场景覆盖能力将推动国内形成完善的通用机器人智能平台。
Pelican-VL 1.0的开源标志着具身智能进入以数据驱动、开放协同的新阶段。

🏷️

继续阅读

2026年KubeCon + CloudNativeCon欧洲联合活动深入探讨：OpenTofu日
2024年KubeCon欧洲首次亮相的OpenTofu Day，旨在为DevOps工程师和基础设施领导者提供交流平台，聚焦OpenTofu的实际应用、迁移...
首个物理AI数据基座平台“无垠”落户浙江，专治机器人数据荒，家庭工业商业场景全覆盖
浙江推出首个物理AI数据基座平台“无垠”，旨在解决机器人数据短缺问题。该平台结合真实数据与虚拟仿真，提供高质量数据，支持具身智能的训练与应用，推动行业发展。
卡帕西开源Agent自进化训练框架，5分钟一轮实验，48h内揽星9.5k
卡帕西推出开源项目autoresearch，旨在让AI自主进行科研。该框架仅630行代码，支持单GPU运行，每5分钟进行一次实验，AI根据结果自我调整。未...
X/Twitter加强客户端验证导致解锁BL/未谷歌认证设备无法发帖目前已撤回封禁
社交网站X/Twitter加强客户端验证，导致许多正常用户无法通过Android/iOS客户端发帖。虽然此举旨在打击机器人，但反而影响了用户。部分用户反馈...
物理信息机器学习新突破！新型GNN架构可对复杂多体动力系统进行准确预测，赋能机器人/航空航天/材料科学
瑞士洛桑联邦理工学院提出的DYNAMI-CAL GraphNet结合物理规律与图神经网络，显著提高了多体动力系统的建模精度和稳定性，适用于机器人和航空航天等领域。
科研AI出了个狠角色：开源30B小模型，硬刚Gemini和Claude
UniScientist是一个开源的30B参数AI模型，能够实现科研闭环，包括提出假设、收集证据和验证。通过动态系统建模和人类专家的验证，该模型提升了科研...

北京人形开源最新VLM模型，推动具身智能再迈关键一步 !

内容提要

关键要点

标签

继续阅读