DEV Community ·

使用Ollama、vLLM或Transformers在本地安装DeepSeek-R1的逐步指南

💡 原文英文，约1700词，阅读约需7分钟。

📝

内容提要

DeepSeek-R1是一个开源推理模型，拥有6710亿参数，采用专家混合架构，兼具性能与效率。其强化学习方法使其能够自主推理和自我验证，适用于数学和编码等复杂问题。在多个基准测试中，DeepSeek-R1表现优异，提供更好的推理洞察。

🎯

🔎

DeepSeek-R1采用专家混合架构，虽然拥有6710亿参数，但每次前向传递仅激活370亿参数。这种设计不仅提升了推理效率，还降低了计算资源的需求，使其在资源有限的环境中也能高效运行。

根据不同的使用场景，DeepSeek-R1提供了三种安装方法：Ollama适合个人项目，vLLM适合生产环境，而Transformers则为开发者提供了最大的灵活性。选择合适的方法可以显著提高工作效率和模型性能。

DeepSeek-R1的强化学习方法使其能够进行自主推理和自我验证，这在处理复杂问题时尤为重要。相比传统模型，它能提供更深入的推理洞察，适合需要高精度和逻辑推理的应用场景。

❓

DeepSeek-R1是一个开源推理模型，拥有6710亿参数，采用专家混合架构，适用于复杂问题的自主推理和自我验证。

安装DeepSeek-R1的最低系统要求包括500GB磁盘空间和安装Jupyter Notebook或Nvidia Cuda。

使用Ollama安装DeepSeek-R1的步骤包括安装Ollama、确认版本、启动Ollama服务器并运行模型。

vLLM适合生产环境，优化内存使用和高吞吐量，适合大规模应用。

Transformers提供最大灵活性和控制，适合开发者和研究人员进行模型定制和实验。

DeepSeek-R1在多个基准测试中表现优异，优于OpenAI的o1和Claude Sonnet 3.5。

🏷️