小红花·文摘 - 小红花技术领袖俱乐部

完整的671B MoE DeepSeek R1怎么塞进本地化部署？详尽教程大放送！

完整的671B MoE DeepSeek R1怎么塞进本地化部署？详尽教程大放送！

机器之心 ·

DeepSeek R1 671B模型的本地部署指南包括硬件要求和模型选择。使用动态量化版本可将模型大小缩小至131GB，适合普通用户。建议使用高带宽内存设备以提高生成速度。部署步骤包括下载模型文件、安装ollama并创建模型文件。测试结果显示，动态量化模型在生成速度和性能上优于标准版本。

关于DeepSeek R1部署的说明

Xihan Li ·

如何在移动设备上部署Hugging Face模型

如何在移动设备上部署Hugging Face模型

KDnuggets ·

本文探讨了大型语言模型（LLM）的压缩方法，包括Rank-k近似、可微K均值聚类和动态量化等技术，成功减少模型参数并保持性能。研究分析了不同压缩技术对模型性能的影响，旨在为从业者提供实用见解，推动更高效的模型压缩方法发展。

ExCP：通过权重和动量联合缩小实现极限 LLM 检查点压缩

BriefGPT - AI 论文速递 ·