量子位 ·

失联大神李沐B站复更：领读Llama 3.1论文；竞技场Llama 3.1排第三

💡 原文中文，约1500字，阅读约需4分钟。

📝

内容提要

AI专家李牧回到Bilibili，带领阅读Llama 3.1论文。他透露Llama团队最初训练了MoE模型和密集模型，但前者失败了，所以只发布了简化版本。在最新的模型排名中，Llama-3.1-405B排名第三，落后于GPT-4o和Claude-3.5-Sonnet。Llama-3.1-405B在个别类别中表现出色。用户已经开始在各种应用中使用Llama-3.1-405B，例如在Raspberry Pi上运行它，并在GitHub存储库上创建聊天机器人。

🎯

关键要点

AI专家李沐回归B站，解读Llama 3.1论文。
Llama团队最初训练了MoE模型和稠密模型，但MoE模型失败，最终只发布了简化版本。
Llama-3.1-405B在大模型排名中位列第三，仅次于GPT-4o和Claude-3.5-Sonnet。
Llama-3.1-405B在编码、数学、指令遵循等单项中表现优异，稳居前三。
Llama-3.1-70B在总榜上排名第九，整体性能显著提升。
网友们已经开始在Raspberry Pi上运行Llama-3.1-8B，并创建聊天机器人。
有网友使用Llama-3.1-405B生成完整的React应用程序，开发变得更简单。

❓

延伸问答

李沐在B站复更的主要内容是什么？

李沐在B站复更主要是解读Llama 3.1论文，并分享了一些相关的八卦信息。

Llama 3.1模型的训练过程中遇到了什么问题？

Llama团队在训练过程中，MoE模型失败，最终只发布了简化版本的稠密模型。

Llama-3.1-405B在大模型排名中处于什么位置？

Llama-3.1-405B在大模型排名中位列第三，仅次于GPT-4o和Claude-3.5-Sonnet。

Llama-3.1-405B在特定任务中表现如何？

Llama-3.1-405B在编码、数学、指令遵循等单项中表现优异，稳居前三。

用户如何在Raspberry Pi上使用Llama-3.1？

用户可以在Raspberry Pi上运行Llama-3.1-8B，只需下载llamafile文件并配置参数即可。

Llama-3.1-405B的开发潜力如何？

Llama-3.1-405B只接受过“计算最优”训练，下一次迭代可能会有惊人的进展。

🏷️

继续阅读

派早报：Apple 公布 2026 年 Apple 设计大奖得主等
苹果于2026年6月2日公布了Apple设计大奖得主，表彰12款杰出应用和游戏，涵盖六个类别。获奖作品包括grug和Is This Seat Taken?...
一起看比赛的超低延迟直播 + 实时解说连麦 + 高并发弹幕的工程方案
本文探讨了“一起看比赛”的技术方案，强调低延迟的重要性。比赛直播需确保观众同步看到进球，避免剧透。采用超低延迟直播（600ms~1s）和RTC解说连麦，结...
云台相机 2026 大乱斗，它到底怎么来的，又去往哪里？｜硬哲学
2016年，苹果发布AirPods，开启了TWS耳机热潮。2018年，大疆推出Osmo Pocket云台相机，改变了手持摄影市场。尽管初期反响平平，但其便...
用 Amazon Quick 加速日常数据工作
Amazon Quick 是一款企业办公助手，利用自然语言处理技术提升数据处理效率。用户只需描述需求，Quick 即可自动分析、生成报告和执行工作流程，适...
在 Amazon EKS 上使用 NVIDIA GPU Operator 管理自定义 GPU 驱动与 CUDA 工作负载
在Amazon EKS上，使用NVIDIA GPU Operator可以有效管理自定义GPU驱动和CUDA工作负载。EKS通过EC2节点支持GPU工作负载...
Article: Two Misconfigurations That Caused Spark OOM Failures on Kubernetes
After migrating Spark pipelines to Azure Kubernetes Service, two infrastructu...