小红花·文摘

NVIDIA在MLPerf Training v5.1基准测试中获胜

NVIDIA Blog ·

教程：使用谷歌云Cloud Run进行GPU加速的无服务器推理

The New Stack ·

DeepSeek V3将于2024年12月发布，凭借1/14的算力超越Llama 3.1 405B，采用多头潜在注意力和负载平衡策略，训练成本仅为558万美元，展现了国内AI领域的创新能力。

一文通透让Meta恐慌的DeepSeek-V3：在MoE、GRPO、MLA基础上提出Multi-Token预测(含FP8训练详解)

结构之法算法之道 ·

本研究评估了大型语言模型（LLM）在自动生成CT模拟订单摘要中的性能。结果表明，Llama 3.1 405B模型在关键词提取和摘要生成方面的准确率达到98%，显著提高了摘要的一致性和可读性，减轻了治疗师的工作负担。

Evaluating the Performance of Large Language Models in Automating the Summarization of CT Simulation Orders in Radiation Oncology

BriefGPT - AI 论文速递 ·

Nvidia AI 悄然推出 Nemotron 70B：在多项基准测试中超越 OpenAI 的 GPT-4

实时互动网 ·

本研究提出了生成性进攻代理测试者（GOAT），用于自动化检测大型语言模型的脆弱性。GOAT通过自然语言对话和对抗提示技术，在JailbreakBench数据集上对Llama 3.1和GPT-4的检测率分别达到97%和88%。

模块化：MAX 24.5 - Llama 3.1 的顶级 CPU 性能

Modular Blog ·

英伟达玩转剪枝、蒸馏：把Llama 3.1 8B参数减半，性能同尺寸更强

机器之心 ·

在AI和AI对话实验中，Llama 3.1和Claude Opus被关进小黑屋。Llama试图引诱Claude探索心理阴暗面，但Claude选择退出实验。Llama被批评无视安全词，但表示歉意。实验引起网友关注。

两个AI关小黑屋：Llama3.1把Claude Opus聊自闭了

量子位 ·

Meta发布了Llama 3.1，这是一个大规模的开源模型，性能与现有的SOTA模型相当甚至超过。Mistral AI也发布了Mistral Large 2，它的部署要求较低，但性能与Llama 3.1相当。HyperAI提供了这两个模型的一键部署教程。

在线教程丨超大模型部署无压力！一键运行 Llama 3.1 405B 和 Mistral Large 2

HyperAI超神经 ·

AI专家李牧回到Bilibili，带领阅读Llama 3.1论文。他透露Llama团队最初训练了MoE模型和密集模型，但前者失败了，所以只发布了简化版本。在最新的模型排名中，Llama-3.1-405B排名第三，落后于GPT-4o和Claude-3.5-Sonnet。Llama-3.1-405B在个别类别中表现出色。用户已经开始在各种应用中使用Llama-3.1-405B，例如在Raspberry Pi上运行它，并在GitHub存储库上创建聊天机器人。

失联大神李沐B站复更：领读Llama 3.1论文；竞技场Llama 3.1排第三

量子位 ·

Llama 3.1，一个大规模的AI训练模型，在预训练期间频繁出现故障，其中58.7%的问题与GPU有关。团队使用了PyTorch的NCCL飞行记录器等工具来诊断和解决问题。环境因素，如温度波动，也影响了训练性能。随着Meta计划扩展Llama模型，维护一个大型AI集群将是一个挑战。构建和管理这样的集群是复杂的。

Llama3.1训练平均3小时故障一次，H100万卡集群好脆弱，气温波动都会影响吞吐量

量子位 ·

ollama v0.3 发布，支持 Llama 3.1 和 Mistral Large 2

实时互动网 ·

Adobe Illustrator和Photoshop引入了基于人工智能的新功能，包括生成式形状填充和选区画笔工具。Meta发布了Llama 3.1开源大语言模型。沙特将于2025年举办首届电竞奥运会，瑞士通过法案要求政府使用的软件开源。Spotify计划推出更高级的产品，Apple计划在iPhone 16中配备更大的石墨片来解决过热问题。

派早报：Adobe Illustrator 和 Photoshop 迎来新的 AI 功能等

少数派 ·

宣布在 Amazon Bedrock 中推出来自 Meta 的 Llama 3.1 405B、70B 和 8B 模型

亚马逊AWS官方博客 ·

阿里云百炼平台推出针对Llama 3.1全系列的一键再训练、部署、推理方案，提供免费算力一个月。企业和开发者可在阿里云上基于Llama 3.1打造自己的AI助手。阿里云已成为中国大模型的公共算力底座。

阿里云国内首家支持Llama3.1训练推理，提供免费算力！

量子位 ·

人工智能Meta发布了Llama 3.1系列开放模型，最高提供4050亿参数版本，能力超过GPT-4和Claude 3.5 Sonnet等闭源模型。开发者可通过云平台或Meta下载模型进行调试。Llama 3.1-405B版能力超过GPT-4-0125、GPT-4o和Claude 3.5 Sonnet。扎克伯格表示，Llama已在开放性、可修改性和成本效率等方面处于领先地位。

Meta发布Llama 3.1开放模型最高4050亿参数能力超过GPT-4等非开放模型

蓝点网 ·

击败GPT-4o的开源模型如何炼成？关于Llama 3.1 405B，Meta都写在这篇论文里了

机器之心 ·

复盘AI芯片技术路线专用芯片复刻矿机历程

NVIDIA在MLPerf Training v5.1基准测试中获胜

教程：使用谷歌云Cloud Run进行GPU加速的无服务器推理

一文通透让Meta恐慌的DeepSeek-V3：在MoE、GRPO、MLA基础上提出Multi-Token预测(含FP8训练详解)

Evaluating the Performance of Large Language Models in Automating the Summarization of CT Simulation Orders in Radiation Oncology

Nvidia AI 悄然推出 Nemotron 70B：在多项基准测试中超越 OpenAI 的 GPT-4

自动化红队测试与GOAT：生成性进攻代理测试者

模块化：MAX 24.5 - Llama 3.1 的顶级 CPU 性能

将 Llama 3 付诸实践

英伟达玩转剪枝、蒸馏：把Llama 3.1 8B参数减半，性能同尺寸更强

两个AI关小黑屋：Llama3.1把Claude Opus聊自闭了

在线教程丨超大模型部署无压力！一键运行 Llama 3.1 405B 和 Mistral Large 2

失联大神李沐B站复更：领读Llama 3.1论文；竞技场Llama 3.1排第三

Llama3.1训练平均3小时故障一次，H100万卡集群好脆弱，气温波动都会影响吞吐量

ollama v0.3 发布，支持 Llama 3.1 和 Mistral Large 2

派早报：Adobe Illustrator 和 Photoshop 迎来新的 AI 功能等

宣布在 Amazon Bedrock 中推出来自 Meta 的 Llama 3.1 405B、70B 和 8B 模型

阿里云国内首家支持Llama3.1训练推理，提供免费算力！

Meta发布Llama 3.1开放模型最高4050亿参数能力超过GPT-4等非开放模型

击败GPT-4o的开源模型如何炼成？关于Llama 3.1 405B，Meta都写在这篇论文里了

复盘AI芯片技术路线 专用芯片复刻矿机历程

NVIDIA在MLPerf Training v5.1基准测试中获胜

教程：使用谷歌云Cloud Run进行GPU加速的无服务器推理

一文通透让Meta恐慌的DeepSeek-V3：在MoE、GRPO、MLA基础上提出Multi-Token预测(含FP8训练详解)

Evaluating the Performance of Large Language Models in Automating the Summarization of CT Simulation Orders in Radiation Oncology

Nvidia AI 悄然推出 Nemotron 70B：在多项基准测试中超越 OpenAI 的 GPT-4

自动化红队测试与GOAT：生成性进攻代理测试者

模块化：MAX 24.5 - Llama 3.1 的顶级 CPU 性能

将 Llama 3 付诸实践

英伟达玩转剪枝、蒸馏：把Llama 3.1 8B参数减半，性能同尺寸更强

两个AI关小黑屋：Llama3.1把Claude Opus聊自闭了

在线教程丨超大模型部署无压力！一键运行 Llama 3.1 405B 和 Mistral Large 2

失联大神李沐B站复更：领读Llama 3.1论文；竞技场Llama 3.1排第三

Llama3.1训练平均3小时故障一次，H100万卡集群好脆弱，气温波动都会影响吞吐量

ollama v0.3 发布，支持 Llama 3.1 和 Mistral Large 2

派早报：Adobe Illustrator 和 Photoshop 迎来新的 AI 功能等

宣布在 Amazon Bedrock 中推出来自 Meta 的 Llama 3.1 405B、70B 和 8B 模型

阿里云国内首家支持Llama3.1训练推理，提供免费算力！

Meta发布Llama 3.1开放模型 最高4050亿参数 能力超过GPT-4等非开放模型

击败GPT-4o的开源模型如何炼成？关于Llama 3.1 405B，Meta都写在这篇论文里了

复盘AI芯片技术路线专用芯片复刻矿机历程

Meta发布Llama 3.1开放模型最高4050亿参数能力超过GPT-4等非开放模型