Meta发布Llama 3.1 405B,迄今为止最大的开源模型

Meta发布Llama 3.1 405B,迄今为止最大的开源模型

💡 原文英文,约700词,阅读约需3分钟。
📝

内容提要

Meta发布了Llama 3.1 405B语言模型,拥有4050亿参数、15万亿令牌和16000个GPU。云服务提供商支持该模型,包括Databricks、Dell、Nvidia、IBM、Snowflake和Scale AI等。Llama 3.1 405B支持8种语言,提供网页搜索、数学推理和代码执行等工具。用户可以下载权重并在应用中使用。根据Scale AI的SEAL排行榜,Llama 3.1 405B在数学推理和编码方面排名靠前。这次发布是AI行业的战略举措,也是技术上的突破。

🎯

关键要点

  • Meta发布了Llama 3.1 405B语言模型,拥有4050亿参数、15万亿令牌和16000个GPU。
  • 多个云服务提供商支持Llama 3.1 405B,包括Databricks、Dell、Nvidia、IBM、Snowflake和Scale AI。
  • Llama 3.1 405B支持8种语言,提供网页搜索、数学推理和代码执行等工具。
  • 用户可以下载权重并在应用中使用,模型的基准分数接近甚至超过GPT-4o和Claude 3.5 Sonnet。
  • 根据Scale AI的SEAL排行榜,Llama 3.1 405B在数学推理和编码方面排名靠前。
  • Llama 3.1 405B是首个可以免费下载并在个人硬件上运行的GPT-4级大型语言模型。
  • 这些模型不是多模态的,无法理解或创建图像,但Meta承诺将推出多模态版本。
➡️

继续阅读