机器之心 ·

Mistral AI两连发：7B数学推理专用、Mamba2架构代码大模型

💡 原文中文，约1600字，阅读约需4分钟。

📝

内容提要

法国独角兽Mistral AI发布了数学推理模型Mathstral和代码生成模型Codestral Mamba。Mathstral在基准测试中表现优异，Codestral Mamba在HumanEval测试中胜出。模型可免费使用，处理256,000个token的输入。

🎯

关键要点

法国独角兽Mistral AI发布了数学推理模型Mathstral和代码生成模型Codestral Mamba。
Mathstral专注于复杂的数学推理，基于Mistral 7B构建，支持32k上下文窗口。
Mathstral在MATH数据集上取得56.6%的通过率，优于Minerva 540B。
Codestral Mamba是用于代码生成的模型，具有70多亿参数，遵循Apache 2.0开源协议。
Mamba模型具有线性时间推理优势，能够处理无限长度的序列。
Codestral Mamba在HumanEval测试中表现优于其他开源模型。
两个模型均可免费使用，Mathstral和Codestral Mamba的模型权重已在HuggingFace上发布。

❓

延伸问答

Mathstral模型的主要功能是什么？

Mathstral模型专注于复杂的数学推理，能够处理高级数学问题。

Codestral Mamba模型的参数数量是多少？

Codestral Mamba模型具有70多亿个参数。

Mathstral在MATH数据集上的通过率是多少？

Mathstral在MATH数据集上的通过率为56.6%。

Codestral Mamba模型的开源协议是什么？

Codestral Mamba模型遵循Apache 2.0开源协议。

Mathstral模型的上下文窗口长度是多少？

Mathstral模型支持32k的上下文窗口长度。

Codestral Mamba在HumanEval测试中的表现如何？

Codestral Mamba在HumanEval测试中表现优于其他开源模型。

🏷️

标签

Codestral Mamba Mathstral Mistral AI ai 代码生成大模型数学推理

➡️

继续阅读

让 AI 快速「读懂」你的代码仓：Joy-Code-Graph 云端图谱服务的三次进化
代码知识图谱不是要取代 AI 的智能，而是要补齐它对代码全局关系的认知盲区。当 AI 能一眼看清「谁调用了谁、改动会波及哪里」，它写出的代码才真正靠谱；当...
Skill、Subagent 与 Agent 究竟是什么？从一个月度总结实战谈 AI 原生架构
本文通过一个真实的“仓库月度自动统计与总结报告”落地需求，深入剖析 Skill、Subagent 和 Agent 三者的本质区别、协作模式与持久化原理，帮...
美图拿出1亿元，面向全行业寻找AI影像Builder
美图产品挑战赛（Meitu Hatch Catch）火热报名中
Building a serverless AI assistant at Pelago: concept to care in two weeks
Healthcare organizations face a critical scaling challenge – how to maintain ...
How to Build an AI Feature With Gemini: A Practical Guide to Prompt Engineering for Developers
Most prompt engineering tutorials follow the same shape. Install the SDK, pas...
How to Evaluate AI Code Quality: A Practical Guide for Engineers
You asked the AI to write a function. It gave you something that looks right....