量子位 ·

小米的首代机器人VLA大模型来了！丝滑赛德芙，推理延迟仅80ms丨全面开源

💡 原文中文，约4800字，阅读约需12分钟。

📝

内容提要

小米推出首代具身机器人VLA大模型，具备80ms推理延迟和30Hz控制频率，支持消费级显卡运行。通过三项技术创新，该模型提升了自主性，解决了机器人动作连续性和视觉理解能力的问题，展现出优异的仿真和真实环境表现，推动了具身智能的工业应用。

🎯

关键要点

小米推出首代具身机器人VLA大模型，具备80ms推理延迟和30Hz控制频率。
该模型支持消费级显卡（如RTX 4090）运行，展现出优异的仿真和真实环境表现。
小米的VLA大模型通过三项技术创新提升了自主性，解决了机器人动作连续性和视觉理解能力的问题。
模型采用MoT架构，分为大脑和小脑，确保理解能力与动作生成的高效结合。
引入两阶段预训练策略，保护视觉理解能力的同时学习机器人动作。
改良异步方案通过Λ形注意力掩码解决动作惯性问题，确保动作的连续性和实时修正。
Xiaomi-Robotics-0在多个仿真环境中超越现有头部模型，展现出极高的成功率和稳定性。
小米在具身智能领域选择务实路线，强调工业落地与复杂环境适应性。
小米的开源策略降低了技术门槛，推动了行业的透明度和技术讨论。

🏷️

继续阅读

大模型推理资源需求计算及使用场景示例
博客自2016年成立以来，逐步接入CDN并添加功能，如音乐墙、动态和时光，至2021年更新了站点地图。
ABB机器人利用NVIDIA Omniverse大规模交付工业级物理AI
ABB与NVIDIA合作，将工业级物理AI引入工厂，通过整合NVIDIA Omniverse库到RobotStudio，实现高精度仿真，降低工程时间和部署...
首个物理AI数据基座平台“无垠”落户浙江，专治机器人数据荒，家庭工业商业场景全覆盖
浙江推出首个物理AI数据基座平台“无垠”，旨在解决机器人数据短缺问题。该平台结合真实数据与虚拟仿真，提供高质量数据，支持具身智能的训练与应用，推动行业发展。
打败GPT-5.2，嵌入真实工业生产，这个大模型什么来头？
思谋科技的IndustryGPT在工业场景中表现优异，超越了GPT-5.2等通用大模型。通过三场考试，IndustryGPT展示了其在工业知识、工程决策能...
周鸿祎表示360将推出OpenClaw AI机器人一键安装包帮助用户快速部署龙虾
周鸿祎表示，360将推出一键安装版的OpenClaw AI机器人，旨在降低用户的安装门槛，使更多人能够使用AI助手。尽管龙虾概念引起关注，但当前的部署和维...
AReaL x 昇腾，加速大模型全异步RL训练创新
AReaL框架通过全异步强化学习训练，简化大模型开发，提升训练效率和系统可靠性。其核心优势在于解耦式Agentic RL和Single Controlle...

小米的首代机器人VLA大模型来了！丝滑赛德芙，推理延迟仅80ms丨全面开源

内容提要

关键要点

标签

继续阅读