Mistral AI发布了三个开源的语言模型:Mistral NeMo、Codestral Mamba和Mathstral。Mistral NeMo是一个12B参数的通用LLM,支持多种语言。Codestral Mamba是一个7B参数的代码生成模型,具有更快的推理速度和无限上下文长度。Mathstral是一个7B参数的数学和推理模型,针对STEM学科进行了优化。这些模型在基准测试中表现出色。
Mistral AI和Mamba合作开发了一个名为Codestral Mamba的开源模型,它是基于Mamba2架构的代码生成模型。与Transformer架构不同,Mamba架构允许线性时间推理,并理论上支持无限长度的输入。Codestral Mamba在基准测试中表现优异。Mistral AI还发布了一个名为Mathstral的新数学模型。Mathstral在各个学科中表现出色,并且可以在更多推理时间下取得更好的结果。
法国独角兽Mistral AI发布了数学推理模型Mathstral和代码生成模型Codestral Mamba。Mathstral在基准测试中表现优异,Codestral Mamba在HumanEval测试中胜出。模型可免费使用,处理256,000个token的输入。
Mistral发布了编程开发语言模型Codestral Mamba,支持无限长度的输入和256K上下文检索,适合编程开发领域使用。
完成下面两步后,将自动完成登录并继续当前操作。