蚂蚁具身智能明牌了:做大脑,和宇树们错位竞争
💡
原文中文,约5200字,阅读约需13分钟。
📝
内容提要
蚂蚁灵波开源的LingBot-VLA是当前最强的具身智能模型,基于20000小时真实数据,超越多个国际顶尖模型。它通过真实世界数据训练,解决了机器人在环境变化中的适应问题,展现出强大的泛化能力和高效的任务执行能力,为通用人工智能的发展提供了新路径。
🎯
关键要点
- 蚂蚁灵波开源的LingBot-VLA是当前最强的具身智能模型,基于20000小时真实数据。
- LingBot-VLA在权威评测中超越了多个国际顶尖模型,如π0.5和GR00T N1.6。
- LingBot-VLA解决了机器人在环境变化中的适应问题,展现出强大的泛化能力。
- 模型通过真实世界数据训练,首次验证了VLA模型性能与数据规模的Scaling Law。
- LingBot-VLA采用真实世界的机器人操作数据,避免了仿真环境的局限性。
- 研究团队使用9种不同品牌的双臂机器人收集数据,增强了模型的泛化能力。
- 模型架构采用专家混合Transformer,结合高层次语义理解与具体动作生成。
- LingBot-VLA引入深度估计模型,提升了机器人对三维空间的感知能力。
- 训练基础设施经过优化,显著提升了模型训练的效率。
- 在GM-100基准测试中,LingBot-VLA在任务成功率和进度得分上全面领先竞争对手。
- LingBot-VLA提供通用智能基座思路,旨在实现一次训练,多端部署。
- 蚂蚁灵波团队开源模型和评估基准,推动行业向可规模化落地的新阶段迈进。
- 蚂蚁的AGI探索路径包括基础大模型、通用AI助手和具身智能的全面布局。
🏷️
标签
➡️