量子位 ·

DeepSeek满血微调秘籍开源！站在巨人肩膀打造私有模型，教程在此

💡 原文中文，约3400字，阅读约需8分钟。

📝

内容提要

DeepSeek开源了微调工具，支持低成本构建高质量私有模型，提供多种训练工具和灵活配置接口，兼容多种硬件，适合开发者快速上手。通过LoRA优化，显著降低硬件需求，适合预算有限的团队。

🎯

关键要点

DeepSeek开源微调工具，支持低成本构建高质量私有模型。
提供多种训练工具和灵活配置接口，兼容多种硬件。
通过LoRA优化显著降低硬件需求，适合预算有限的团队。
支持混合精度训练和训练加速，降低成本。
数据集准备需使用JSONL格式，兼容Huggingface chat template。
模型权重建议使用BF16格式进行微调。
提供一键启动脚本，兼容HuggingFace PEFT。
使用LoRA优化可将硬件要求降低近10倍。
Colossal-AI团队验证了DeepSeek论文中的GRPO算法。
用户可灵活配置奖励函数，设计自己的奖励体系。
Colossal-AI致力于成为开发者开箱即用的最佳后训练工具。

❓

延伸问答

DeepSeek的微调工具有什么特点？

DeepSeek的微调工具支持低成本构建高质量私有模型，提供多种训练工具和灵活配置接口，兼容多种硬件。

如何准备数据集以用于DeepSeek的微调？

数据集需使用JSONL格式，兼容Huggingface chat template，每行应为一个聊天对话列表。

使用DeepSeek进行微调时，模型权重应该使用什么格式？

建议使用BF16格式进行微调，以保证更好的效果。

LoRA优化对硬件需求有什么影响？

使用LoRA优化可以将硬件要求降低近10倍，适合预算有限的团队。

DeepSeek支持哪些硬件？

DeepSeek兼容多种硬件，包括英伟达GPU和华为昇腾NPU。

Colossal-AI团队在DeepSeek中实现了什么算法？

Colossal-AI团队验证并实现了DeepSeek论文中的GRPO算法。

🏷️

继续阅读

开始在 Amazon Bedrock 上使用 OpenAI GPT-5.5、GPT-5.4 模型和 Codex
OpenAI的GPT-5.5和GPT-5.4模型以及Codex已在Amazon Bedrock平台上线。这些模型专注于代码编写和复杂工作流程，支持开发者通...
谷歌Gemma 4 12B的性能几乎与26B基准相当——并可在您的笔记本电脑上运行
谷歌推出了Gemma 4 12B模型，旨在为标准笔记本电脑提供高性能的多模态智能。该模型内存占用比Gemma 4 26B小一半，但性能接近，支持本地运行，...
Gemma 4 QAT模型：优化移动设备和笔记本电脑的模型压缩效率
Gemma 4最近发布了优化的量化感知训练（QAT）检查点，提升了模型在移动设备上的效率，减少了压缩时的质量损失，显著降低了内存占用，适合在日常边缘设备上...
阿里开源Open Code Review：一款AI代码评审命令行工具
阿里巴巴开源的Open Code Review（OCR）是一款AI代码审查工具，能够自动审查Git提交和代码变更。它通过分析代码库，识别潜在的空指针、线程...
智源&清华合作成果登上Science：脑科学多模态基础模型Brainμ支撑揭示“记忆-睡眠”调控的神经机制
研究表明，睡眠中的记忆重激活影响睡眠动态，提供了“记忆-睡眠”双向作用的新证据。智源研究院与清华大学的研究发现，负向记忆再激活加剧睡眠碎片化，而正向记忆再...
[开源] 阿里巴巴发布AI驱动的代码审查工具Open Code Review 帮助开发者审查代码
阿里巴巴开源了基于人工智能的代码审查工具Open Code Review（OCR），旨在解决传统审查中的覆盖不全、位置漂移和不稳定等问题。开发者可通过配置...