Blog on Qwen ·

Qwen2.5-LLM：扩展大型语言模型的边界

💡 原文中文，约12900字，阅读约需31分钟。

📝

内容提要

Qwen2.5系列语言模型发布，包含7款开源模型，参数范围从0.5B到72B。新模型在通用任务、数学和代码生成等方面表现显著提升，特别是在MMLU和MATH基准测试中得分提高。Qwen2.5-72B-Instruct在多个核心任务中超越同类模型，适合移动端应用。

🎯

🔎

Qwen2.5系列模型的参数范围从0.5B到72B，涵盖了不同用户需求。特别是3B和14B的中等规模模型，适合移动端应用，满足了对高效能和低资源消耗的需求。这使得开发者可以根据具体场景选择合适的模型，提升应用的灵活性。

Qwen2.5在多个基准测试中表现出色，尤其是在MMLU和MATH等任务中得分显著提高。这表明新模型在自然语言理解和数学推理方面的能力有了质的飞跃，适合需要高精度的应用场景，如教育和科研领域。

Qwen2.5生成的内容更符合人类偏好，指令跟随能力显著提升。这一特性使得模型在实际应用中能够更好地理解用户意图，提供更为精准的响应，尤其在对话系统和智能助手等领域具有重要意义。

❓

Qwen2.5系列语言模型在参数规模、预训练数据集、数学和代码生成能力等方面有显著提升，特别是在多个基准测试中表现优异。

Qwen2.5-72B-Instruct在多个核心任务上超越了同类模型，特别是在数学和代码生成任务中表现突出。

Qwen2.5系列模型适合移动端应用，尤其是Qwen2.5-3B模型，满足对轻量级模型的需求。

Qwen2.5在MATH基准测试中的得分显著提高，Qwen2.5-7B和72B-Instruct的得分分别从52.9和69.0提升到75.5和83.1。

Qwen2.5系列模型的参数范围从0.5B到72B，共包含7款开源模型。

Qwen2.5的预训练数据集规模从7T tokens扩展到18T tokens，知识储备更广。

🏷️