Meta开源Llama 3发布

原文约1400字,阅读约需4分钟。发表于:

Meta发布迄今为止最有能力的开源大模型:Llama 3 要点: 此次发布 Llama(Meta Llama 3)的前两个型号,可供广泛使用。此版本具有经过预训练和指令微调的语言模型,具有 8B 和 70B 参数,可以支持广泛的用例。 Llama-3 8b 在基准测试中击败 Llama-2 70b ! Llama-3  70B击败Claude Sonnet! Llama-3 400B 将可能轻松击败 GPT-4 和 Opus。目前 400b 的基准测试显示分数低于 Opus,但它仍在训练中! 推理、代码生成和指令跟踪等功能的极大改进,使 Llama 3 更加易于操控。 截至目前,却只有 8K

Meta发布了开源大模型Llama 3,具有8B和70B参数,可支持广泛用例。Llama-3 8B在基准测试中击败Llama-2 70B,Llama-3 70B击败Claude Sonnet。Llama-3 400B可能轻松击败GPT-4和Opus。Llama 3更易于操控,但只有8K上下文长度,稍后将发布更长上下文窗口的版本。与ChatGPT相比,Llama 3在多个指标上表现更好。Llama 3比GPT-3.5更先进。Llama 3有8B和70B参数版本,仅实现文本输入到文本输出。计划发布多模态版本和更大上下文窗口。Llama 3进行了预训练和训练,有内部评估但未交给建模团队。总之,现在有一个相当于GPT4的开源模型Llama 3 400B。期待Open AI发布GPT5和Google发布Gemini 2或Gemini 1.5 Ultra。

相关推荐 去reddit讨论