量子位 ·

Qwen2.5登全球开源王座！72B击败LIama3 405B，轻松胜过GPT-4o-mini

💡 原文中文，约3000字，阅读约需7分钟。

📝

内容提要

Qwen2.5在任务中超越了LIama3和GPT-4o-mini，在指令跟踪、文本生成、数据理解和输出生成方面有所改进。提供不同的参数规模。在数学、编程和一般任务中表现出色。代码和数学模型已发布。在多个领域取得显著进展。

🎯

关键要点

Qwen2.5在指令跟踪、文本生成、数据理解和输出生成方面超越LIama3和GPT-4o-mini。
Qwen2.5提供了多种参数规模，包括0.5B、1.5B、3B、7B、14B、32B和72B。
此次开源是史上最大规模，基础模型直接发布了7个参数型号。
Qwen2.5的预训练数据集从7万亿个token扩展到最多18万亿个token。
在数学、编程和一般任务中，Qwen2.5表现出色，尤其在数学和编码任务上超越了Gemma2-2.6B。
Qwen2.5-Coder和Qwen2.5-Math模型分别针对代码和数学问题进行了优化。
Qwen2.5模型支持128K上下文，增强了对系统提示的适应能力。
团队在开源过程中认识到许多问题，并通过用户反馈不断改进模型。
未来将深入研究推理能力，以进一步提升模型性能。

❓

延伸问答

Qwen2.5相比于LIama3和GPT-4o-mini有哪些优势？

Qwen2.5在指令跟踪、文本生成、数据理解和输出生成方面超越了LIama3和GPT-4o-mini，尤其在数学和编码任务上表现出色。

Qwen2.5提供了哪些参数规模？

Qwen2.5提供了0.5B、1.5B、3B、7B、14B、32B和72B等多种参数规模。

Qwen2.5的预训练数据集有何变化？

Qwen2.5的预训练数据集从7万亿个token扩展到最多18万亿个token，提升了数据质量和数量。

Qwen2.5-Coder和Qwen2.5-Math模型的主要功能是什么？

Qwen2.5-Coder主要针对代码问题进行了优化，而Qwen2.5-Math则专注于解决数学问题，支持中英文。

Qwen2.5在数学和编码任务上的表现如何？

Qwen2.5在数学和编码任务上表现优异，尤其是Qwen2.5-0.5B在这些任务上优于Gemma2-2.6B。

Qwen2.5的开源规模有多大？

Qwen2.5是史上最大规模的开源，基础模型直接发布了7个参数型号。

🏷️

标签

GPT-4o-mini LIama3 Qwen2.5 gpt 开源数学编程

➡️

继续阅读

GPT-5.6自己优化自己实锤了，新的左脚踩右脚已经出现
OpenAI的RSI焚诀，它来了！
GPT-5.6 Sol打开两个设置：ARC-AGI-3评分从7.8%翻三倍38.3%
把记忆开关打开，模型分数从7.8%飙到38.3%，输出token少了六倍，算不算打脸那些说AI不会玩游戏的评论。 OpenAI发现GPT-5.6 Sol在...
物理AI模型对决：Claude Fable 5碾压GPT-5.6家族
模型打架你站谁？物理AI考场全记录。 OpenAI和Anthropic的顶级模型在物理建模考场正面交锋，五道密封考题，52次严格评分，分数、成本、时间全部...
全球代理对接说明
本文档主要介绍 Ace Data Cloud 全球代理的对接说明，包括申请方法、实用方法等具体内容。申请方法要使用
OpenAI fixed GPT-5.6 Sol’s most frustrating flaw: Burning limits while it waits
OpenAI introduced GPT-5.6 Sol earlier this month as a model built for more de...
全球最大的 WordPress 主题商店 ThemeForest 也顶不住了，AI 时代 WordPress 主题生意还能做吗？
前面我们刚刚聊了「WordPress 主题现状：一半主题两年就没人管，一半新主题是区块主题，但 90% 以上站长还在用经典主题！」说的是 WordPre...