机器之心 ·

最强模型Llama 3.1 405B正式发布，扎克伯格：开源引领新时代

💡 原文中文，约3500字，阅读约需9分钟。

📝

内容提要

Meta发布了Llama 3.1，这是世界上最大且最强大的开源语言模型。新版本支持八种语言，并将上下文长度扩展到128K。Llama 3.1与闭源模型相媲美，提供了各种组件来创建全面的系统。Meta还计划开发具有集成语音和视觉功能的模型。模型可以从Meta网站和Hugging Face下载。评估结果显示，Llama 3.1在各种任务中与领先的模型竞争力相当。Llama 3.1的架构经过优化，可进行大规模训练，使用了超过150万亿个标记。该模型还支持指令和基于聊天的微调。Meta发布了完整的参考系统和标准化接口，以促进与行业和开源社区的合作。开发人员可以根据自己的需求和应用定制模型。

🎯

关键要点

Meta发布了Llama 3.1，这是世界上最大且最强大的开源语言模型。
新版本支持八种语言，并将上下文长度扩展到128K。
Llama 3.1与闭源模型相媲美，提供了各种组件来创建全面的系统。
模型可以从Meta网站和Hugging Face下载。
评估结果显示，Llama 3.1在各种任务中与领先的模型竞争力相当。
Llama 3.1的架构经过优化，可进行大规模训练，使用了超过150万亿个标记。
该模型支持指令和基于聊天的微调。
Meta发布了完整的参考系统和标准化接口，以促进与行业和开源社区的合作。
开发人员可以根据自己的需求和应用定制模型。
Meta CEO扎克伯格强调开源对开发者和社会的重要性。
Llama 3.1在常识、可操纵性、数学、工具使用和多语言翻译等方面表现出色。
Meta对开源协议进行了更改，允许开发人员使用Llama模型的输出改进其他模型。
Meta在超过150个基准数据集上评估了Llama 3.1，结果显示其与领先模型竞争力相当。
Llama 3.1的训练使用了超过15万亿个token，优化了训练堆栈。
Meta采用标准解码器Transformer模型架构，以提高训练稳定性。
Llama 3.1的后训练阶段通过多轮对齐来提高模型响应用户指令的能力。
Meta发布了完整的参考系统和多个示例应用程序，支持开发者定制模型。
Llama 3.1 405B模型的高级功能开放，开发者可以进行实时推理和监督式微调。
Meta与AWS、NVIDIA和Databricks合作，优化模型的云端部署和性能。

❓

延伸问答

Llama 3.1的主要特点是什么？

Llama 3.1是世界上最大且最强大的开源语言模型，支持八种语言，上下文长度扩展到128K，并与顶级闭源模型相媲美。

如何下载Llama 3.1模型？

用户可以从Meta网站和Hugging Face下载Llama 3.1模型。

Llama 3.1在评估中表现如何？

Llama 3.1在超过150个基准数据集上评估，结果显示其在多项任务中与领先模型竞争力相当。

Llama 3.1支持哪些高级用例？

Llama 3.1支持长篇文本摘要、多语言对话智能体和编码助手等高级用例。

Meta对开源协议做了哪些更改？

Meta更改了开源协议，允许开发人员使用Llama模型的输出改进其他模型。

Llama 3.1的训练规模有多大？

Llama 3.1的训练使用了超过15万亿个token，并在超过16,000个H100 GPU上进行训练。

🏷️