量子位 ·

开放全栈！超越π0，具身智能基础大模型迎来真·开源，开发者狂喜

💡 原文中文，约4500字，阅读约需11分钟。

📝

内容提要

WALL-OSS正式开源，超越π0，成为具身智能领域唯一具备多模态统一输出能力的模型，支持低成本训练，适用于多种场景，推动行业发展，降低技术门槛。

🎯

🔎

WALL-OSS在模态统一、动作精度和能力泛化之间实现了平衡，打破了具身智能领域的技术难题。这种创新架构使得模型在多种场景下都能保持高效的表现，尤其是在复杂任务中，展现出优异的环境适应性。开发者应关注这一技术进步如何影响未来的应用场景。

WALL-OSS的全面开源降低了具身智能的技术门槛，使得更多开发者能够快速部署和微调模型。这一举措不仅促进了技术的透明化，也为中小企业和科研团队提供了宝贵的资源，推动整个行业的公平竞争与创新。

WALL-OSS的训练和推理过程仅需RTX 4090级别的显卡，显著降低了硬件要求。这使得更多开发者能够以较低的成本进行具身智能的开发与应用，值得关注的是，如何在不同硬件平台上实现最佳性能。

❓

WALL-OSS是一个具身智能基础模型，具备多模态统一输出能力，支持低成本训练，适用于多种场景。

WALL-OSS通过共享注意力和专家分流机制的架构设计，避免了模态解耦和灾难性遗忘，实现了模态统一与动作精度的平衡。

WALL-OSS的开源降低了具身智能的进入门槛，使得开发者可以快速部署和微调模型，促进了技术的公平与透明化发展。

WALL-OSS采用了启发阶段和融合阶段的训练策略，以增强模型的认知能力与动作执行力。

WALL-OSS在4.2B参数规模下展现出领先的性能优势，尤其在OOD场景下表现优异。

WALL-OSS适用于养老护理、工业装配、酒店服务和物流分拣等多种应用场景。

🏷️