机器之心 ·

完整的671B MoE DeepSeek R1怎么塞进本地化部署？详尽教程大放送！

💡 原文中文，约8000字，阅读约需19分钟。

📝

内容提要

AIxiv专栏促进学术交流，报道超过2000篇内容。DeepSeek R1模型通过动态量化技术实现本地部署，降低硬件要求。作者提供详细的部署步骤和测试结果，建议在消费级硬件上进行轻量任务。

🎯

🔎

动态量化技术使得DeepSeek R1模型的体积大幅缩减，从720GB压缩至131GB，这对于大多数用户而言，降低了本地部署的门槛。通过这种方式，用户可以在消费级硬件上运行完整的模型，充分发挥其潜力，而不必依赖高端设备。

部署DeepSeek R1模型时，内存和显存的配置至关重要。建议的配置为内存与显存总和≥200GB，以确保模型的流畅运行。用户在选择硬件时，应考虑到模型的需求，避免因资源不足导致的性能瓶颈。

在选择DeepSeek R1的不同版本时，用户应根据自身的硬件条件和任务需求进行选择。1.73-bit版本在速度和资源占用上更具优势，适合短文本生成等轻量任务，而4-bit版本则在处理复杂提示时表现更为保守。

❓

可以通过下载模型文件、安装ollama、创建Modelfile文件并运行模型来实现本地部署。

动态量化技术可以将模型体积从720GB压缩至131GB，降低本地部署的硬件要求。

建议配置内存和显存总和≥200GB，具体取决于所选模型版本。

在短文本生成任务中，DeepSeek R1模型表现良好，速度可达7-8 token/秒。

应避免长思维链或多轮对话场景，以免生成速度降低至1-2 token/秒。

4-bit版本更倾向于礼貌拒绝攻击性提示，而1.73-bit版本输出较为直接。

🏷️