Mistral AI 发布 Mistral Small 4：一款拥有 1190 亿参数的 MoE 模型

实时互动网 ·

Mistral AI 发布 Mistral Small 4：一款拥有 1190 亿参数的 MoE 模型

💡 原文中文，约2300字，阅读约需6分钟。

📝

内容提要

Mistral AI 发布了 Mistral Small 4，具备指令执行、推理和多模态理解功能，支持256k上下文窗口，具有可配置推理强度，提升了推理效率和经济性，适合通用聊天和复杂推理。

🎯

关键要点

Mistral AI 发布了 Mistral Small 4，整合了多种功能于一个模型中。
该模型为混合专家 (MoE) 模型，包含128位专家，每个token有4位活跃专家。
支持256k的上下文窗口，适用于长文档分析和多模态任务。
引入可配置的推理强度，允许开发者根据需求调整推理深度。
在延迟优化下，完成时间缩短40%，吞吐量提高3倍。
推理性能与GPT-OSS 120B持平或更优，且输出更短。
提供自托管架构指导，建议使用特定的NVIDIA硬件配置。

❓

延伸问答

Mistral Small 4 的主要功能是什么？

Mistral Small 4 结合了指令执行、推理、多模态理解和智能体编码等功能，作为一个通用助手和推理模型运行。

Mistral Small 4 的架构特点是什么？

Mistral Small 4 是一个混合专家 (MoE) 模型，包含128位专家，每个token有4位活跃专家，总参数量为1190亿。

Mistral Small 4 支持多大的上下文窗口？

该模型支持256k的上下文窗口，适用于长文档分析和多模态任务。

如何调整 Mistral Small 4 的推理强度？

开发者可以通过设置 reasoning_effort 参数来调整推理强度，从而在延迟和推理深度之间进行权衡。

Mistral Small 4 的推理性能如何？

在推理基准测试中，Mistral Small 4 的性能与GPT-OSS 120B持平或更优，且输出更短。

Mistral Small 4 的部署要求是什么？

建议的最低部署配置为4块NVIDIA HGX H100或2块NVIDIA HGX H200，或1块NVIDIA DGX B200。

🏷️

继续阅读

解决“打地鼠困境”：一种更智能的去偏见AI视觉模型的方法
WRING是一种新型去偏见技术，通过调整模型中特定坐标的表示方式，减少目标概念的偏见，同时不增加其他领域的偏见。该方法高效且无需重新训练模型，适用于视觉语...
在线教程丨高性能与易部署兼得，DeepSeek-V4-Flash模型参数284B，简单任务可媲美1.6T Pro版模型
DeepSeek V4 最近发布，分为 DeepSeek-V4-Pro 和 DeepSeek-V4-Flash 两个版本。Pro 版本参数达到 1.6T，...
Zed AI 白嫖免费模型，搭配 DeepSeek v4，玩转 Agent 编程技巧 - 曦远Code
Zed 编辑器功能灵活，支持多种 AI 模型，用户可通过 ACP 协议配置 agent。虽然 AI 功能有限，但适合日常开发和文档生成，提供免费模型使用，...
企业在AI应用中获胜的关键是首先构建数据层
Trinity Industries通过构建强大的数据基础，实现了AI驱动的转型。首席数据官Stephen Ecker指出，数据层是战略核心，解决了数据碎...
将AI令牌使用量减少96%？AWS Strands Agents是如何做到的
AWS开发者倡导者摩根·威利斯讨论了Strands Agents的开源框架，该框架自发布以来已下载超过1400万次。她演示了如何通过意图驱动的工具将API...
在PyCharm中使用词袋模型
本文介绍了词袋模型（BoW）在自然语言处理中的应用，强调其通过记录词汇出现频率将文本转换为数值向量的有效性。BoW适用于文本分类和情感分析等任务。文章还展...