机器之心 ·

首个超越GPT4o级开源模型！Llama 3.1泄密：4050亿参数，下载链接、模型卡都有了

💡 原文中文，约3600字，阅读约需9分钟。

📝

内容提要

Llama 3.1是一种大型语言模型，在Reddit上泄露。它包括8B、70B和405B的基准测试结果。与之前的版本相比，8B和70B模型显示出显著的性能改进。该模型支持多种语言，用于商业应用和研究。它经过15T+标记的训练，包括公共数据和合成数据。Llama 3.1针对对话使用案例进行了优化，并且在许多开源和闭源聊天模型中表现出色。建议在官方发布之前等待下载模型。

🎯

关键要点

Llama 3.1是一种大型语言模型，在Reddit上泄露，包含8B、70B和405B的基准测试结果。
8B和70B模型相比于之前版本有显著性能提升，首次开源模型超越了GPT-4o和Claude Sonnet 3.5等闭源模型。
模型使用了超过15万亿个标记进行训练，支持多种语言，包括英语、法语、德语等。
Llama 3.1针对多语言对话用例进行了优化，适用于商业应用和研究。
模型架构为优化的Transformer，自回归语言模型，使用SFT和RLHF进行微调。
训练期间的温室气体排放量预估为11,390吨二氧化碳当量，Meta保持净零温室气体排放。
Llama 3.1的设计宗旨是开放、包容和乐于助人，旨在服务于每个人。
开发人员在使用Llama 3.1时需进行安全测试和微调，以应对潜在的输出风险。

❓

延伸问答

Llama 3.1的参数规模是多少？

Llama 3.1包括8B、70B和最大参数的405B。

Llama 3.1与GPT-4o相比有什么优势？

Llama 3.1的8B和70B模型在多个基准测试中超过了GPT-4o，显示出显著的性能提升。

Llama 3.1支持哪些语言？

Llama 3.1支持英语、法语、德语、印地语、意大利语、葡萄牙语、西班牙语和泰语。

Llama 3.1的训练数据量是多少？

Llama 3.1使用了超过15万亿个标记进行训练。

Llama 3.1的设计宗旨是什么？

Llama 3.1的设计宗旨是开放、包容和乐于助人，旨在服务于每个人。

使用Llama 3.1时需要注意什么安全问题？

开发人员在使用Llama 3.1时需进行安全测试和微调，以应对潜在的输出风险。

🏷️