使用亚马逊云科技自研芯片 Inferentia2 部署 DeepSeek R1 Distillation 模型（一）

亚马逊AWS官方博客 ·

使用亚马逊云科技自研芯片 Inferentia2 部署 DeepSeek R1 Distillation 模型（一）

💡 原文中文，约4700字，阅读约需12分钟。

📝

内容提要

亚马逊云科技将于2025年1月推出DeepSeek系列大模型，用户可通过多种方式部署DeepSeek-R1模型。该模型可在自研芯片Inferentia2上高效运行，支持Docker容器和在线推理，服务覆盖多个地区，具备价格优势，满足全球客户需求。

🎯

关键要点

亚马逊云科技将于2025年1月推出DeepSeek系列大模型，用户可通过多种方式部署DeepSeek-R1模型。
DeepSeek-R1模型可在自研芯片Inferentia2上高效运行，支持Docker容器和在线推理。
服务覆盖多个地区，具备价格优势，满足全球客户需求。
用户可以通过Amazon Bedrock Marketplace、Amazon SageMaker JumpStart等方式部署DeepSeek-R1模型。
Inferentia2是亚马逊云科技自主研发的云端机器学习推理芯片，提供高性能和高效率的计算能力。
文章分为两篇，第一篇介绍如何使用Inferentia2部署DeepSeek R1 Distillation模型，第二篇介绍如何使用SageMaker Endpoint部署模型。
创建EC2实例时需申请增加配额，使用inf2.8xlarge作为实例类型。
制作Docker镜像需要进行ECR身份验证，并创建Dockerfile文件以包含所需工具。
下载模型权重并创建Docker容器以运行vLLM推理服务器。
启动vLLM Docker容器并进行客户端测试，使用curl命令进行API调用。
亚马逊云科技在多个地区提供Trn1/Inf2实例，具有40%以上的价格优势，满足全球客户需求。

❓

延伸问答

DeepSeek-R1模型可以通过哪些方式部署？

DeepSeek-R1模型可以通过Amazon Bedrock Marketplace、Amazon SageMaker JumpStart和Amazon Bedrock Custom Model Import等方式部署。

Inferentia2芯片的主要功能是什么？

Inferentia2芯片是亚马逊云科技自主研发的云端机器学习推理芯片，提供高性能和高效率的计算能力，支持深度学习推理工作负载。

如何创建Docker镜像以部署DeepSeek-R1模型？

创建Docker镜像需要进行ECR身份验证，并创建Dockerfile文件以包含所需工具，最后使用docker build命令构建镜像。

使用DeepSeek-R1模型进行在线推理的步骤是什么？

启动vLLM Docker容器后，可以使用curl命令进行API调用进行在线推理，测试模型的输出。

DeepSeek-R1模型的价格优势如何？

DeepSeek-R1模型在多个地区提供服务，具有40%以上的价格优势，满足全球客户需求。

创建EC2实例时需要注意什么？

创建EC2实例时需申请增加配额，并使用inf2.8xlarge作为实例类型。

🏷️

继续阅读

便宜好用真香！美国企业把DeepSeek买上了趋势榜第一
Ramp发布的2026年热门软件供应商榜单显示，中国AI公司DeepSeek首次重返增长，企业采用率为0.1%。其成本显著低于Anthropic和Open...
Gemma 4 QAT模型：优化移动设备和笔记本电脑的模型压缩效率
Gemma 4最近发布了优化的量化感知训练（QAT）检查点，提升了模型在移动设备上的效率，减少了压缩时的质量损失，显著降低了内存占用，适合在日常边缘设备上...
智源&清华合作成果登上Science：脑科学多模态基础模型Brainμ支撑揭示“记忆-睡眠”调控的神经机制
研究表明，睡眠中的记忆重激活影响睡眠动态，提供了“记忆-睡眠”双向作用的新证据。智源研究院与清华大学的研究发现，负向记忆再激活加剧睡眠碎片化，而正向记忆再...
基于220种海洋细菌，科学家用基因组尺度模型重构异养微生物分类体系，挖出8类代谢菌群
研究揭示海洋异养微生物的代谢生态位，打破传统的富营养型与寡营养型二分法，提出8类代谢菌群。通过基因组分析，阐明其生长规律与资源竞争，推动全球碳循环研究，为...
微软MAI模型发布深度解读：前沿微调成企业AI护城河
微软在2026年推出的MAI系列模型标志着其从依赖OpenAI转向自建AI模型的战略转变。MAI模型涵盖推理、编码、图像和语音等多个领域，特别是通过“前沿...
开始在 Amazon Bedrock 上使用 OpenAI GPT-5.5、GPT-5.4 模型和 Codex
OpenAI的GPT-5.5和GPT-5.4模型以及Codex已在Amazon Bedrock平台上线。这些模型专注于代码编写和复杂工作流程，支持开发者通...