国产具身智能模型WALL-OSS在RoboChallenge评测中以46.43分排名全球第二,超越美国的pi0。该模型开源,具备透明性和可复现性,推动了具身智能的发展,并在多项任务中展现出强大能力。
本文讨论了改进版的π0.5及其在视觉-语言-动作(VLA)模型中的应用,强调知识隔离策略在保持VLM预训练能力的同时,解决模态差距和数据稀缺问题。通过引入专家混合架构,WALL-OSS模型增强了跨模态关联能力,提高了指令遵循和长时序任务的成功率。
WALL-OSS正式开源,超越π0,成为具身智能领域唯一具备多模态统一输出能力的模型,支持低成本训练,适用于多种场景,推动行业发展,降低技术门槛。
完成下面两步后,将自动完成登录并继续当前操作。