量子位 ·

开源大模型杀疯了！Mistral新模型三分之一参数卷爆Llama 3.1，“新趋势已显而易见”

💡 原文中文，约4100字，阅读约需10分钟。

📝

内容提要

Mistral AI发布了最新的模型Mistral Large 2，拥有123B个参数，与Llama 3.1 405B和其他闭源模型相媲美。它在代码和数学推理方面表现出色，支持多种编程语言，并在基准测试中取得了高准确度。Mistral Large 2在语言理解任务和逻辑推理方面也展示了改进的性能。它可以在Mistral AI的开发者平台上使用，并可通过云服务提供商访问。但商业使用需要单独的许可证。该模型在回答具有挑战性的问题方面取得了进展，但仍有改进的空间。

🎯

关键要点

Mistral AI发布了新模型Mistral Large 2，参数为123B，性能与Llama 3.1 405B相当。
Mistral Large 2在代码和数学推理方面表现出色，支持多种编程语言。
该模型在MMLU基准测试中达到了84.0%的准确率，展示了语言理解能力的提升。
Mistral Large 2可通过Mistral AI的开发者平台和云服务访问，但商业使用需单独许可证。
模型在回答复杂问题方面有所进步，但仍有改进空间，特别是在逻辑推理和内容生成方面。
Mistral Large 2在处理多任务和增强函数调用能力方面超越了GPT-4o。
模型在安全性方面表现良好，但仍存在绕过安全措施的风险。
Mistral Large 2的逻辑推理能力较强，但在灵活性和细节处理上仍有不足。

❓

延伸问答

Mistral Large 2的参数数量是多少？

Mistral Large 2的参数数量为123B。

Mistral Large 2在代码生成方面的表现如何？

Mistral Large 2在代码生成方面表现出色，支持80多种编程语言，其能力可与GPT-4o和Llama 3.1相媲美。

Mistral Large 2的准确率在MMLU基准测试中是多少？

Mistral Large 2在MMLU基准测试中达到了84.0%的准确率。

如何访问Mistral Large 2模型？

Mistral Large 2可以通过Mistral AI的开发者平台和云服务提供商访问，但商业使用需要单独许可证。

Mistral Large 2在逻辑推理方面的表现如何？

Mistral Large 2在逻辑推理方面表现较强，但在灵活性和细节处理上仍有不足。

Mistral Large 2的安全性如何？

Mistral Large 2在安全性方面表现良好，但仍存在绕过安全措施的风险。

🏷️