小红花·文摘

Mistral AI发布了开源模型Mixtral 8x7B，采用稀疏的专家混合网络架构，每个token分配给两个专家处理。模型参数总量46.7B，每个token仅使用12.9B个参数。Mixtral在基准测试中优于Llama 2 70B和GPT3.5。Mixtral还发布了指令遵循模型Mixtral 8x7B Instruct，在MT-Bench上获得8.30分数。