使用亚马逊云科技自研芯片 Inferentia2 部署 DeepSeek R1 Distillation 模型（二）

亚马逊AWS官方博客 ·

使用亚马逊云科技自研芯片 Inferentia2 部署 DeepSeek R1 Distillation 模型（二）

💡 原文中文，约13300字，阅读约需32分钟。

📝

内容提要

亚马逊云科技将在2025年1月推出DeepSeek系列大模型，用户可通过多种方式部署DeepSeek-R1模型。文章介绍了如何在SageMaker上快速部署DeepSeek-R1-Distill模型，包括创建Docker容器和在线推理的步骤。

🎯

关键要点

亚马逊云科技将在2025年1月推出DeepSeek系列大模型，用户可通过多种方式部署DeepSeek-R1模型。
用户可以通过Amazon Bedrock Marketplace、Amazon SageMaker JumpStart、Amazon Bedrock Custom Model Import等方式部署DeepSeek-R1模型。
Inferentia2是亚马逊云科技自主研发的云端机器学习推理芯片，提供高性能和高效率的计算能力。
文章分为两篇介绍DeepSeek-R1-Distill模型的部署方法。
使用SageMaker AI托管服务部署模型的好处包括完全托管基础设施、自动缩放、自动修补等。
提供多种推理选项，如实时端点和批量转换。
使用Hugging Face提供的推理容器进行部署时，模型代码可在model card内找到。
自定义vLLM推理容器部署允许用户创建特定环境以满足需求。
创建Docker镜像时需确保容器在8080端口列出网络服务器，并接受特定POST请求。
在SageMaker Notebook中执行相关命令以创建Docker容器并推送到Amazon ECR。
上传模型权重到S3存储桶，并通过指向S3中的模型工件创建SageMaker模型。
通过SageMaker创建端点配置并部署模型，用户可在控制台查看进度。
提供Python代码示例以调用SageMaker Endpoint进行推理。
完成测试后，需清除SageMaker相关资源以释放资源。
亚马逊云科技提供多种工具和优化方法以提高模型编译和运行效率。

❓

延伸问答

DeepSeek-R1模型可以通过哪些方式部署？

DeepSeek-R1模型可以通过Amazon Bedrock Marketplace、Amazon SageMaker JumpStart、Amazon Bedrock Custom Model Import等方式部署。

Inferentia2芯片的主要功能是什么？

Inferentia2芯片是亚马逊云科技自主研发的云端机器学习推理芯片，提供高性能和高效率的计算能力。

使用SageMaker部署DeepSeek-R1-Distill模型有哪些好处？

使用SageMaker部署模型的好处包括完全托管基础设施、自动缩放、自动修补等。

如何在SageMaker中创建Docker容器？

在SageMaker Notebook中执行相关命令以创建Docker容器，并确保容器在8080端口列出网络服务器，接受特定POST请求。

如何上传模型权重到S3存储桶？

可以使用Python代码将模型权重上传到S3存储桶，首先需要创建一个包含sagemaker的S3存储桶，然后运行相应的上传命令。

如何调用SageMaker Endpoint进行推理？

可以使用Python代码调用SageMaker Endpoint，构造请求并发送到指定的端点以执行推理。

🏷️

继续阅读

便宜好用真香！美国企业把DeepSeek买上了趋势榜第一
Ramp发布的2026年热门软件供应商榜单显示，中国AI公司DeepSeek首次重返增长，企业采用率为0.1%。其成本显著低于Anthropic和Open...
存之有序，治之有矩——Agent 记忆系统的工程实践与演进
本文探讨了Agent记忆系统的工程实践与演进，分析了记忆写入纪律、Prompt Cache冲突、跨模型容量、Embedding迁移及Agent自产Skil...
Gemma 4 QAT模型：优化移动设备和笔记本电脑的模型压缩效率
Gemma 4最近发布了优化的量化感知训练（QAT）检查点，提升了模型在移动设备上的效率，减少了压缩时的质量损失，显著降低了内存占用，适合在日常边缘设备上...
智源&清华合作成果登上Science：脑科学多模态基础模型Brainμ支撑揭示“记忆-睡眠”调控的神经机制
研究表明，睡眠中的记忆重激活影响睡眠动态，提供了“记忆-睡眠”双向作用的新证据。智源研究院与清华大学的研究发现，负向记忆再激活加剧睡眠碎片化，而正向记忆再...
基于220种海洋细菌，科学家用基因组尺度模型重构异养微生物分类体系，挖出8类代谢菌群
研究揭示海洋异养微生物的代谢生态位，打破传统的富营养型与寡营养型二分法，提出8类代谢菌群。通过基因组分析，阐明其生长规律与资源竞争，推动全球碳循环研究，为...
微软MAI模型发布深度解读：前沿微调成企业AI护城河
微软在2026年推出的MAI系列模型标志着其从依赖OpenAI转向自建AI模型的战略转变。MAI模型涵盖推理、编码、图像和语音等多个领域，特别是通过“前沿...