机器之心 ·

通义千问开源Qwen2-Math，成为最先进的数学专项模型

💡 原文中文，约1300字，阅读约需3分钟。

📝

内容提要

阿里通义团队开源了新一代数学模型Qwen2-Math，包含1.5B、7B、72B三个参数的基础模型和指令微调模型。Qwen2-Math-72B-Instruct在MATH基准测评中的准确率达到84%，超过其他开源数学模型。Qwen2-Math基础模型使用Qwen2大语言模型进行初始化，并在数学专用语料库上进行预训练。研发团队训练了指令微调版本模型，通过奖励模型和二元信号进行学习。Qwen2-Math目前主要支持英文，但将推出中英双语版本和多语言版本。阿里通义团队希望通过开源模型为科学界解决高级数学问题做出贡献。

🎯

关键要点

阿里通义团队开源新一代数学模型Qwen2-Math，包含1.5B、7B、72B三个参数的基础模型和指令微调模型。
旗舰模型Qwen2-Math-72B-Instruct在MATH基准测评中准确率达到84%，超越其他开源数学模型。
Qwen2-Math基础模型使用Qwen2大语言模型进行初始化，并在数学专用语料库上进行预训练。
研发团队训练了指令微调版本模型，结合奖励模型和二元信号进行学习。
Qwen2-Math目前主要支持英文，未来将推出中英双语版本和多语言版本。
通义团队在多个数学基准测评集对模型进行了性能评估，Qwen2-Math-72B-Instruct在十大测评中表现优异。
团队希望通过开源模型为科学界解决高级数学问题做出贡献，未来将持续增强模型的数学能力。

🏷️

继续阅读

当开源的门缝变窄，真正需要我们警觉的是什么？
2025年4月13日，中国开发者在访问GitHub时遭遇403访问限制，标志着该平台对中国的封锁。这一事件影响了全球开源生态，促使开发者重新思考技术依赖，...
Open Notebook：真正的开源私有NotebookLM替代品？
Open Notebook是一个开源AI平台，旨在安全记录和管理笔记，避免敏感数据泄露。与云端笔记本不同，它支持本地部署，确保用户对数据的完全控制。该平台...
LeCun创业0产品估值247亿，回应谢赛宁入伙
LeCun创办的Advanced Machine Intelligence（AMI）估值247亿，专注于世界模型，强调开源和理解真实世界的重要性。他批评M...
🌟 GSoC 2026 来了！与我们一起迎接又一个创新之年 🌟
谷歌夏季代码（GSoC）2026正式启动，ASF将连续第21年参与。GSoC旨在吸引新贡献者参与开源软件开发，项目持续12周以上。自2005年以来，ASF...
为什么平台公司不断收购前端框架团队
Cloudflare最近收购了前端框架Astro，反映出大型平台对流行框架的支持。Cloudflare希望通过Astro推动更好的互联网，支持独立网站，并...
跨平台 iCloud 照片同步，命令行自动下载备份工具 | 开源日报 No.859
IPTV 提供全球免费高清电视频道，vllm-omni 是高效的多模态模型推理框架，Vendure 是可定制的无头电商平台，icloud_photos_d...

通义千问开源Qwen2-Math，成为最先进的数学专项模型

内容提要

关键要点

标签

继续阅读