💡
原文中文,约1600字,阅读约需4分钟。
📝
内容提要
法国独角兽Mistral AI发布了数学推理模型Mathstral和代码生成模型Codestral Mamba。Mathstral在基准测试中表现优异,Codestral Mamba在HumanEval测试中胜出。模型可免费使用,处理256,000个token的输入。
🎯
关键要点
- 法国独角兽Mistral AI发布了数学推理模型Mathstral和代码生成模型Codestral Mamba。
- Mathstral专注于复杂的数学推理,基于Mistral 7B构建,支持32k上下文窗口。
- Mathstral在MATH数据集上取得56.6%的通过率,优于Minerva 540B。
- Codestral Mamba是用于代码生成的模型,具有70多亿参数,遵循Apache 2.0开源协议。
- Mamba模型具有线性时间推理优势,能够处理无限长度的序列。
- Codestral Mamba在HumanEval测试中表现优于其他开源模型。
- 两个模型均可免费使用,Mathstral和Codestral Mamba的模型权重已在HuggingFace上发布。
❓
延伸问答
Mathstral模型的主要功能是什么?
Mathstral模型专注于复杂的数学推理,能够处理高级数学问题。
Codestral Mamba模型的参数数量是多少?
Codestral Mamba模型具有70多亿个参数。
Mathstral在MATH数据集上的通过率是多少?
Mathstral在MATH数据集上的通过率为56.6%。
Codestral Mamba模型的开源协议是什么?
Codestral Mamba模型遵循Apache 2.0开源协议。
Mathstral模型的上下文窗口长度是多少?
Mathstral模型支持32k的上下文窗口长度。
Codestral Mamba在HumanEval测试中的表现如何?
Codestral Mamba在HumanEval测试中表现优于其他开源模型。
🏷️
标签
➡️