InfoQ ·

Mistral AI发布两款小型语言模型Les Ministraux

💡 原文英文，约600词，阅读约需3分钟。

📝

内容提要

Mistral AI发布了两款小型语言模型Ministral 3B和8B，称为les Ministraux，专为本地推理应用设计，性能优于同类模型。8B模型采用滑动窗口注意力机制，推理速度更快。与之前的Mistral 7B不同，les Ministraux需商业许可，并可通过API访问，适用于隐私优先的关键应用。

🎯

关键要点

Mistral AI发布了两款小型语言模型Ministral 3B和8B，称为les Ministraux，专为本地推理应用设计。
这两款模型在多项LLM基准测试中表现优于同类模型。
Ministral 8B采用滑动窗口注意力机制，推理速度更快。
与之前的Mistral 7B不同，les Ministraux需商业许可，并可通过API访问。
les Ministraux适用于隐私优先的关键应用，如设备翻译、无网络智能助手、本地分析和自主机器人。
Mistral AI还开发了其他多个专用模型，大多数模型采用Apache 2.0许可证。
les Ministraux在MMLU、Winogrande和GSM8k等基准测试中表现优异，3B模型超越Llama 3.2 3B和Gemma 2 2B。
在Hacker News讨论中，用户对模型需商业许可表示遗憾，但也指出API的可用性。
用户质疑Mistral AI与Meta等大型模型创作者的竞争能力，认为需要更好的API平台。
Ministral 8B Instruct模型权重可从Huggingface下载用于研究目的。

🔎

延伸解读

隐私优先的应用场景

les Ministraux模型专为隐私优先的本地推理应用设计，适合设备翻译、无网络智能助手等场景。这些应用对数据安全性要求高，使用这些模型可以有效保护用户隐私，避免数据泄露风险。

商业许可的影响

与之前的Mistral 7B不同，les Ministraux需要商业许可，这可能限制了其在开发者社区中的普及。尽管如此，API的可用性为用户提供了灵活的访问方式，但仍需关注许可政策对使用场景的限制。

性能与竞争力

les Ministraux在多项基准测试中表现优异，超越了许多同类模型。然而，用户对Mistral AI能否与Meta等大型模型竞争表示担忧，尤其是在API平台的完善性上，这可能影响其市场接受度。

❓

延伸问答

Mistral AI发布了哪些新模型？

Mistral AI发布了Ministral 3B和Ministral 8B两款小型语言模型，统称为les Ministraux。

Ministral 8B模型的特点是什么？

Ministral 8B采用滑动窗口注意力机制，推理速度更快，并且具有128k的上下文长度。

les Ministraux模型的使用许可是什么？

les Ministraux模型需要商业许可才能使用，而之前的Mistral 7B模型则不需要。

les Ministraux适合哪些应用场景？

les Ministraux适用于隐私优先的关键应用，如设备翻译、无网络智能助手、本地分析和自主机器人。

Ministral 3B在基准测试中的表现如何？

Ministral 3B在MMLU、Winogrande和GSM8k等基准测试中表现优异，超越了Llama 3.2 3B和Gemma 2 2B。

用户对les Ministraux模型的反馈如何？

用户对模型需商业许可表示遗憾，但也指出API的可用性，认为Mistral AI需要更好的API平台以与大型模型竞争。

🏷️