小红花·文摘

Meta 发布了唯一开源的 Llama 3.3 模型 Llama-3.3-70B-Instruct，其性能可与 405B 模型媲美。该系列的最后一款模型，期待 Llama 4 的推出。hyper.ai 提供一键部署及优质数据集和教程，支持 AI 研究与应用。

在线运行 Llama 3.3 唯一开源 70B 模型，性能堪比 405B！LaTeX OCR 数据集上线，助力数学公式识别

HyperAI超神经 ·

Meta 发布了唯一开源模型 Llama 3.3 的 Llama-3.3-70B-Instruct，性能可与 405B 模型媲美。该系列的最后一款模型，未来将推出 Llama 4。hyper.ai 提供一键部署及优质数据集和教程，提升用户体验与研究。

在线运行 Llama 3.3 唯一开源 70B 模型，性能堪比 405B！LaTeX OCR 数据集上线，助力数学公式识别...

HyperAI超神经 ·

Meta发布的Llama 3.3以70B参数实现405B性能，成本显著降低。谷歌的Gemini 1206更新后重回榜首，马斯克的Grok 3即将发布，市场竞争激烈。

新版Llama 3 70B反超405B！Meta开卷后训练，谷歌马斯克都来抢镜

量子位 ·

微调大模型，AMD MI300X就够了！跟着这篇博客微调Llama 3.1 405B，效果媲美H100

机器之心 ·

Qwen2.5在任务中超越了LIama3和GPT-4o-mini，在指令跟踪、文本生成、数据理解和输出生成方面有所改进。提供不同的参数规模。在数学、编程和一般任务中表现出色。代码和数学模型已发布。在多个领域取得显著进展。

Qwen2.5登全球开源王座！72B击败LIama3 405B，轻松胜过GPT-4o-mini

量子位 ·

本文研究了量化对大型语言模型的影响，发现4位量化模型在新兴能力上表现良好，而2位模型性能显著下降。通过块量化技术，实现了几乎无损的6位量化，提升了计算和内存效率。此外，提出了激活量化感知和序列长度感知等创新技术，显著提高了任务准确度，为大型语言模型的高效部署提供了新思路。

量化指令调优大语言模型的综合评估：实验分析至405B

BriefGPT - AI 论文速递 ·

Meta发布了备受期待的Llama-3.1系列模型，包括405B“超级杯”型号，成为首个能与最强大模型媲美的开源模型。Llama-3.1系列包括8B、70B和405B三个版本，具有128k的扩展上下文长度和支持八种语言。405B模型目前是最大的开源模型，在各种评估指标上超过了GPT-4。SiliconCloud在其平台上推出了Llama-3.1系列模型，使开发者更容易访问和使用这些先进模型。该平台还提供加速推理和实惠的价格。除了Llama-3.1，SiliconCloud还提供各种其他开源语言模型、图像生成模型和代码生成模型。开发者可以免费使用这些模型，消除了开发和大规模推广中的计算成本。SiliconCloud旨在为开发者提供更快、更便宜、更全面的模型API，以实现更流畅的用户体验。

比肩GPT4，没有显卡也能用Llama-3.1-405B

OneFlow深度学习框架 ·

北航商汤南洋理工等团队联合推出了Llama 3.1 405B的压缩工具，能够以超低成本进行量化。该工具支持多种压缩算法、模型和推理后端，具有强大的扩展性和全方位的评估能力。研究团队已将使用方法放在GitHub主页上。

单卡搞定Llama 3.1 405B，让大模型轻松瘦身！超强压缩工具包来了

量子位 ·

Meta发布Llama 3.1 405B，迄今为止最大的开源模型

InfoQ ·

贾扬清点赞：3K star量的SGLang上新，加速Llama 405B推理秒杀vLLM、TensorRT-LLM

机器之心 ·

宣布在 Amazon Bedrock 中推出来自 Meta 的 Llama 3.1 405B、70B 和 8B 模型

亚马逊AWS官方博客 ·

最强模型Llama 3.1 405B正式发布，扎克伯格：开源引领新时代

机器之心 ·

Llama 3.1发布：开源AI是未来吗？

极道 ·

开源模型Llama 3.1发布，超越闭源模型GPT-4o和Claude 3.5 Sonnet。Llama 3.1支持八种语言，上下文长度扩展到128K。模型架构采用标准的仅解码器的Transformer架构，并做一些细微改动。Llama 3.1的推理成本低，支持实时和批量推理、监督微调等。开源人工智能对开发者、Meta和世界都有好处。

开源=最强大模型！Llama3.1发布，405B超越闭源GPT-4o，扎克伯格：分水岭时刻

量子位 ·

赶超 GPT-4o，最强大模型 Llama 3.1 405B 一夜封神，扎克伯格：开源引领新时代

爱范儿 ·

上周AI动态 #280 - GPT-4o mini、Llama 3.1 405B、SmoLLM、YouTube训练数据等！

Last Week in AI ·

Meta发布新款Llama 3.1模型，包括备受期待的405B参数版本

IBM Blog ·