InfoQ ·

Ai2推出OLMo 2，完全开源的基础模型

💡 原文英文，约500词，阅读约需2分钟。

📝

内容提要

Allen人工智能研究所推出了OLMo 2系列开源语言模型，参数为70亿和130亿。该模型经过5万亿个标记训练，采用分阶段训练和多样化数据集，显著提升了训练稳定性和模型鲁棒性。在知识回忆、推理和语言能力方面，OLMo 2超越了前代模型，成为开源AI的新标杆。

🎯

关键要点

Allen人工智能研究所推出了OLMo 2系列开源语言模型，参数为70亿和130亿。
OLMo 2经过5万亿个标记训练，采用分阶段训练和多样化数据集，提升了训练稳定性和模型鲁棒性。
OLMo 2的架构改进了层归一化，采用RMSNorm和旋转位置嵌入，以及Z-loss正则化。
训练过程分为两个阶段，第一阶段使用OLMo-Mix-1124数据集，第二阶段进行Dolmino-Mix-1124的微调。
模型合并技术（model souping）对最终版本的性能优化至关重要。
OLMo 2在所有评估任务中显著超越前代模型OLMo-0424，设定了开源语言建模的新基准。
OLMo 2 7B超越Llama-3.1 8B，OLMo 2 13B超越Qwen 2.5 7B，尽管训练FLOPs更少。
使用开放语言建模评估系统（OLMES）确认了OLMo 2在知识回忆、推理和语言能力方面的优势。
OLMo 2的推出标志着语言建模领域的重大转变，解决了训练稳定性和评估透明性的问题。
AI社区对OLMo 2的发布反应热烈，认可Ai2对开源的承诺。
OLMo 2模型及其权重、数据、代码、配方和中间检查点均已公开。
OLMES的引入提供了结构化基准，以指导模型开发和有效跟踪进展。
后训练方法（如监督微调、偏好微调和可验证奖励的强化学习）增强了模型的指令跟随能力。

❓

延伸问答

OLMo 2模型的参数有多少？

OLMo 2模型有70亿和130亿两个参数配置。

OLMo 2是如何提升训练稳定性的？

OLMo 2采用分阶段训练和多样化数据集，显著提升了训练稳定性和模型鲁棒性。

OLMo 2与前代模型相比有哪些优势？

OLMo 2在知识回忆、推理和语言能力方面超越了前代模型OLMo-0424，设定了新的开源语言建模基准。

OLMo 2的训练数据集是怎样的？

OLMo 2的训练过程分为两个阶段，第一阶段使用OLMo-Mix-1124数据集，第二阶段进行Dolmino-Mix-1124的微调。

OLMo 2的发布对AI社区有什么影响？

AI社区对OLMo 2的发布反应热烈，认可Ai2对开源的承诺，认为这是开源AI的重要进展。

OLMo 2的评估系统是什么？

OLMo 2使用开放语言建模评估系统（OLMES），提供结构化基准以指导模型开发和跟踪进展。

🏷️

继续阅读

腾讯混元开源全新翻译模型Hy-MT2 ，上线小程序「腾讯Hy翻译」
腾讯混元推出的新翻译模型Hy-MT2支持33种语言互译，具备强大的指令遵循能力，尤其在金融、政治和教育领域表现优异。该模型提供多种尺寸以适应不同硬件，并支...
Artificial Analysis放榜：千问3.7问鼎国产模型冠军，全球前五
阿里云新发布的Qwen3.7-Max大模型在全球大模型榜单中得分56.6，位列全球第五、国产第一，超越多款国产模型。该模型在编程、智能体和推理等方面有显著...
模型人人都能用，什么才是你能带走的？我的答案是一个可进化的SKILL库
文章讨论了如何将AI工作流转化为可积累、跨平台的技能资产。通过SumSec-Skills，用户可以将教AI的经验结构化并存储在Git仓库中，确保技能不受工...
OpenAI内部模型推翻了离散几何核心猜想引发争论
OpenAI的通用AI模型推翻了离散几何学中的核心猜想，证明单位距离图的数量可以超出线性增长。该模型通过125页的推理，结合不同数学领域，展示了AI在代数...
超越引擎：10个开源项目塑造游戏制作的方式
Stacey Haffner是微软OSPO的主任，专注于开源、人工智能和开发者工具。她在.NET、Xbox和Unity等领域拥有超过十年的经验，并且是一名...
Kore倒计时Artemis，旨在实现可治理的AI智能体的月球计划
Kore公司推出了Artemis平台，旨在简化多智能体AI系统的开发与管理。该平台采用声明式蓝图语言，支持无代码和有代码开发，提供治理和可移植性。Arte...