阿里巴巴发布了两个开放权重的语言模型系列:Qwen2-Math和Qwen2-Audio。Qwen2-Math是用于解决数学问题的LLM系列,Qwen2-Audio是一系列多模态LLM,可以接受语音或文本输入。这两个系列都基于阿里巴巴的Qwen2 LLM系列,除了Qwen2-Math的最大版本外,其他版本都可在Apache 2.0许可下使用。Qwen2-Math有基础版本和经过指导调优的版本,每个版本都有1.5B、7B或72B参数的选择。阿里巴巴在训练数据集上进行了去污染处理,以删除数学问题解决基准示例。阿里巴巴计划发布支持英语和中文的双语模型,并开发多语言模型。他们还将继续提升模型解决复杂和具有挑战性的数学问题的能力。阿里巴巴在GSM8K和AIME 2024等基准测试和数学考试中评估了Qwen2-Math,发现Qwen2-Math-Instruct在可比大小的其他基准模型中表现更好,特别是在1.5B和7B模型中。
阿里开源Qwen2-Math,数学推理全球第一。麻省理工开发乳腺癌预测AI模型。清华研究团队首创全前向智能光计算训练架构。马斯克的Neuralink今年有望完成10例植入手术。AI酶设计公司获5000万种子轮融资。
阿里通义团队开源了新一代数学模型Qwen2-Math,包含1.5B、7B、72B三个参数的基础模型和指令微调模型。Qwen2-Math-72B-Instruct在MATH基准测评中的准确率达到84%,超过其他开源数学模型。Qwen2-Math基础模型使用Qwen2大语言模型进行初始化,并在数学专用语料库上进行预训练。研发团队训练了指令微调版本模型,通过奖励模型和二元信号进行学习。Qwen2-Math目前主要支持英文,但将推出中英双语版本和多语言版本。阿里通义团队希望通过开源模型为科学界解决高级数学问题做出贡献。
Qwen2-Math是基于Qwen2构建的数学专用语言模型系列,旨在提升数学解题能力。旗舰模型Qwen2-Math-72B-Instruct在多个数学基准测试中表现优异,超越了GPT-4o等模型,并将推出中英双语版本,以满足更广泛的用户需求。
完成下面两步后,将自动完成登录并继续当前操作。