量子位 ·

LIama 4发布重夺开源第一！DeepSeek同等代码能力但参数减一半，一张H100就能跑，还有两万亿参数超大杯

💡 原文中文，约5400字，阅读约需13分钟。

📝

内容提要

Meta发布Llama 4系列，包括Llama 4 Scout和Maverick，采用MoE架构，显著减少参数量，性能超越GPT-4.5。新模型支持百万上下文，具备多模态能力，运行成本低，标志着开源AI新时代。

🎯

🔎

Llama 4系列模型标志着多模态AI的新时代，用户可以通过上传图片进行交互，获取与图像相关的信息。这种能力不仅提升了用户体验，也为开发者提供了更广泛的应用场景，如图像识别和内容生成等。

Llama 4采用混合专家（MoE）架构，显著提高了计算效率和模型性能。通过激活部分参数，模型在保持高性能的同时，降低了运行成本和延迟。这使得开发者在资源有限的情况下，也能有效部署强大的AI模型。

Llama 4 Maverick在性能和价格上优于DeepSeek，成为开源模型中的佼佼者。这一竞争态势促使AI领域的技术进步加速，开发者在选择模型时需关注性价比和实际应用需求，以便做出最佳决策。

❓

Llama 4系列包括Llama 4 Scout、Maverick和Behemoth，采用MoE架构，显著减少参数量，支持百万上下文窗口，具备多模态能力，性能超越GPT-4.5。

Llama 4 Scout和Maverick均为170亿激活参数，而Llama 4 Behemoth则为2万亿参数。

Llama 4系列采用混合专家MoE架构，只有部分参数在训练和推理时被激活，从而提高计算效率，降低服务成本和延迟。

Llama 4系列支持12种语言，方便全球开发者的部署。

Llama 4 Scout提供行业领先的100万上下文窗口，具有高级长度泛化能力。

Llama 4 Behemoth的训练效率提高了约10倍，具备更强的推理和编码能力。

🏷️