阿里达摩院开源具身大脑基模:3B激活参数性能超越72B,转身就忘事的机器人有救了

💡 原文中文,约4600字,阅读约需11分钟。
📝

内容提要

阿里达摩院开源了具身大脑基础模型RynnBrain,该模型具备时空记忆和物理空间推理能力,性能超越现有顶尖模型,优化了训练速度和数据处理,提升了机器人在复杂任务中的表现,推动了具身智能的发展。

🎯

关键要点

  • 阿里达摩院开源了具身大脑基础模型RynnBrain,具备时空记忆和物理空间推理能力。

  • RynnBrain在20项具身Benchmark上超越了英伟达和谷歌的顶尖模型,表现出色。

  • RynnBrain-30B-A3B模型仅需3B激活参数,性能超越72B的Pelican-VL模型。

  • RynnBrain采用自研的RynnScale架构,训练速度提升至200%。

  • 模型训练使用了超过2000万对高质量语料,增强了具身认知能力。

  • RynnBrain支持多种输入输出形式,具备灵活的多模态输出能力。

  • RynnBrain具备时空记忆,能够在任务中准确找回之前的任务断点。

  • 模型采用新的推理策略,结合文本与空间定位,降低幻觉问题。

  • RynnBrain展现了良好的可拓展性,微调后在导航和操作规划任务上表现优异。

  • 达摩院采用大小脑分层架构,提升了具身智能的泛化能力和模块化迭代。

  • RynnBrain开源了完整的推理训练代码和评测基准RynnBrain-Bench,降低了行业门槛。

  • 达摩院致力于构建具身智能生态,推动行业的良性竞争与发展。

延伸问答

RynnBrain模型的主要特点是什么?

RynnBrain模型具备时空记忆和物理空间推理能力,性能超越现有顶尖模型,且激活参数仅需3B。

RynnBrain如何提升机器人的任务执行能力?

RynnBrain通过时空记忆和物理空间推理,帮助机器人在复杂任务中准确找回任务断点,提升执行能力。

RynnBrain的训练数据来源是什么?

RynnBrain使用了超过2000万对高质量语料,包括自研的多模态训练数据和物体认知相关数据。

RynnBrain的开源对行业有什么影响?

RynnBrain的开源降低了研发、系统和协作门槛,促进了具身智能生态的建设和行业竞争。

RynnBrain在Benchmark测试中的表现如何?

RynnBrain在20项具身Benchmark上超越了英伟达和谷歌的顶尖模型,实现了16个SOTA。

RynnBrain的推理策略有什么创新之处?

RynnBrain采用了文本与空间定位交错的推理策略,降低了具身任务中的幻觉问题。

➡️

继续阅读