InfoQ ·

Mistral AI发布三款开源语言模型

💡 原文英文，约600词，阅读约需3分钟。

📝

内容提要

Mistral AI发布了三个开源的语言模型：Mistral NeMo、Codestral Mamba和Mathstral。Mistral NeMo是一个12B参数的通用LLM，支持多种语言。Codestral Mamba是一个7B参数的代码生成模型，具有更快的推理速度和无限上下文长度。Mathstral是一个7B参数的数学和推理模型，针对STEM学科进行了优化。这些模型在基准测试中表现出色。

🎯

关键要点

Mistral AI发布了三个开源语言模型：Mistral NeMo、Codestral Mamba和Mathstral。
Mistral NeMo是一个12B参数的通用LLM，支持多种语言，具有128k的上下文窗口。
Codestral Mamba是一个7B参数的代码生成模型，推理速度更快，支持无限上下文长度。
Mathstral是一个7B参数的数学和推理模型，针对STEM学科进行了优化。
Mistral NeMo在多个基准测试中表现优于同类模型。
Codestral Mamba基于Mamba架构，提供快速响应，性能与大型Transformer模型相当。
Mathstral在多个基准测试中表现出色，具有先进的推理能力。
用户在Hacker News上讨论了Mistral NeMo的性能和使用限制。
Mistral NeMo和Codestral Mamba可以通过Huggingface或Mistral的SDK下载，支持NVIDIA的NIM推理微服务和TensorRT-LLM。

❓

延伸问答

Mistral AI发布了哪些语言模型？

Mistral AI发布了Mistral NeMo、Codestral Mamba和Mathstral三款语言模型。

Mistral NeMo的参数和特点是什么？

Mistral NeMo是一个12B参数的通用LLM，支持多种语言，具有128k的上下文窗口。

Codestral Mamba与传统Transformer模型相比有什么优势？

Codestral Mamba基于Mamba架构，提供更快的推理速度和理论上的无限上下文长度。

Mathstral模型是如何优化的？

Mathstral是一个7B参数的模型，专门针对STEM学科进行了优化，具有先进的推理能力。

这些模型在哪里可以下载？

Mistral NeMo和Codestral Mamba可以通过Huggingface或Mistral的SDK下载。

Mistral NeMo在基准测试中的表现如何？

Mistral NeMo在多个基准测试中表现优于同类模型，如MMLU和Winogrande。

🏷️

继续阅读

阿里开源Open Code Review：一款AI代码评审命令行工具
阿里巴巴开源的Open Code Review（OCR）是一款AI代码审查工具，能够自动审查Git提交和代码变更。它通过分析代码库，识别潜在的空指针、线程...
[开源] 阿里巴巴发布AI驱动的代码审查工具Open Code Review 帮助开发者审查代码
阿里巴巴开源了基于人工智能的代码审查工具Open Code Review（OCR），旨在解决传统审查中的覆盖不全、位置漂移和不稳定等问题。开发者可通过配置...
知识图谱+本地存储：开源Mnemo给AI配的长期记忆中枢
Mnemo是为大语言模型设计的本地优先长期记忆层，旨在解决AI每次会话忘记上下文的问题。它通过构建知识图谱存储历史对话和信息，帮助AI在后续提问中自动召回...
我们在2026年5月发布的最新AI新闻
谷歌在2026年5月推出了多个AI相关产品，包括Gemini 3.5和Gemini Omni，旨在提升日常生活便利性。新应用Google Health和F...
深入探讨语言模型的校准：Platt缩放、等距回归与温度缩放
大型语言模型（LLMs）普遍存在误校准问题，导致信心分数与实际正确率不符。传统的后处理校准方法包括温度缩放、Platt缩放和等距回归，但由于LLMs的复杂...
有人靠CPU把AI算力密度卷到了新高度
英特尔推出新技术以应对Agentic AI的算力焦虑，提升AI算力密度，推动数据中心和AI的发展。