IBM Blog ·

Meta发布新款Llama 3.1模型，包括备受期待的405B参数版本

💡 原文英文，约2300词，阅读约需9分钟。

📝

内容提要

Meta发布了Llama 3.1系列的多语言大型语言模型（LLM）。Llama 3.1-405B模型是最大的开源语言模型，拥有405B个参数，可在IBM Watsonx上部署。该版本包括更长的上下文长度、扩展的工具使用和多语言能力。与领先模型相比，Llama 3.1模型取得了令人印象深刻的性能基准。发布还包括安全措施和防护措施。Llama 3.1模型可用于合成数据生成、知识蒸馏、其他模型的评估和微调。模型具有更长的上下文窗口、改进的安全措施，并且支持多语言。IBM Watsonx提供了定制和实施Llama 3.1模型的平台。

🎯

关键要点

Meta发布了Llama 3.1系列的多语言大型语言模型，包括405B参数的Llama 3.1-405B模型。
Llama 3.1-405B是目前最大的开源语言模型，具有更长的上下文长度和多语言能力。
Llama 3.1模型在性能基准测试中表现出色，能够与领先的专有模型竞争。
Meta与IBM合作推出AI联盟，旨在推动开放、负责任的AI创新。
Llama 3.1提供了强大的系统安全措施和网络安全评估措施。
Llama 3.1-405B在多个基准测试中表现优异，超越了许多领先模型。
Llama 3.1模型支持合成数据生成、知识蒸馏和模型评估。
Llama 3.1的上下文长度从8192个标记扩展到128000个标记，提升了模型的记忆能力。
Llama 3.1模型支持多种语言，包括西班牙语、葡萄牙语、意大利语、德语和泰语。
Llama 3.1模型经过优化，能够更好地与工具接口，支持零-shot工具使用。
IBM watsonx为Llama 3.1模型的定制和实施提供了平台支持。

❓

延伸问答

Llama 3.1-405B模型的参数数量是多少？

Llama 3.1-405B模型拥有4050亿个参数。

Llama 3.1模型的上下文长度有多长？

Llama 3.1模型的上下文长度扩展到128000个标记。

Llama 3.1模型支持哪些语言？

Llama 3.1模型支持多种语言，包括西班牙语、葡萄牙语、意大利语、德语和泰语。

Llama 3.1-405B模型在性能基准测试中表现如何？

Llama 3.1-405B模型在多个基准测试中表现优异，超越了许多领先模型。

如何使用Llama 3.1模型进行知识蒸馏？

可以将Llama 3.1-405B模型的知识蒸馏到更小的模型中，以结合大模型的能力和小模型的高效推理。

Meta与IBM的AI联盟有什么目标？

AI联盟旨在推动开放、负责任的AI创新，促进开发者和研究人员的合作。

🏷️