Mistral AI发布了三个开源的语言模型:Mistral NeMo、Codestral Mamba和Mathstral。Mistral NeMo是一个12B参数的通用LLM,支持多种语言。Codestral Mamba是一个7B参数的代码生成模型,具有更快的推理速度和无限上下文长度。Mathstral是一个7B参数的数学和推理模型,针对STEM学科进行了优化。这些模型在基准测试中表现出色。
Mistral AI和Mamba合作开发了一个名为Codestral Mamba的开源模型,它是基于Mamba2架构的代码生成模型。与Transformer架构不同,Mamba架构允许线性时间推理,并理论上支持无限长度的输入。Codestral Mamba在基准测试中表现优异。Mistral AI还发布了一个名为Mathstral的新数学模型。Mathstral在各个学科中表现出色,并且可以在更多推理时间下取得更好的结果。
法国独角兽Mistral AI发布了数学推理模型Mathstral和代码生成模型Codestral Mamba。Mathstral在基准测试中表现优异,Codestral Mamba在HumanEval测试中胜出。模型可免费使用,处理256,000个token的输入。
人工智能开发商Mistral开源了数学推理和科学模型Mathstral-7B,该模型解决复杂的高级数学问题,提供32K上下文,可用于STEM学科。模型基于Mistral-7B开发,可通过微调进行训练。模型已在HuggingFace平台上发布,使用Apache 2.0许可证开源。
完成下面两步后,将自动完成登录并继续当前操作。