Mistral AI发布三款开源语言模型
原文英文,约600词,阅读约需3分钟。发表于: 。Mistral AI released three open-weight language models: Mistral NeMo, a 12B parameter general-purpose LLM; Codestral Mamba, a 7B parameter code-generation model; and Mathstral, a 7B parameter model...
Mistral AI发布了三个开源的语言模型:Mistral NeMo、Codestral Mamba和Mathstral。Mistral NeMo是一个12B参数的通用LLM,支持多种语言。Codestral Mamba是一个7B参数的代码生成模型,具有更快的推理速度和无限上下文长度。Mathstral是一个7B参数的数学和推理模型,针对STEM学科进行了优化。这些模型在基准测试中表现出色。