小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

大模型训练应视为流水线,分为数据工程、预训练、中训、微调和对齐等阶段。每个环节有不同的算力需求和挑战,数据质量至关重要。预训练需处理大量干净数据以确保模型稳定性,中训通过调整数据配比提升能力,微调教会模型理解指令,对齐阶段则使用多种算法优化模型表现。整体训练过程复杂,需关注数据、算力和工程细节。

【大模型基础设施工程】05:训练全景:Pre-train、SFT、RLHF、DPO、蒸馏

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-22T00:00:00Z
在线教程丨Qwen3.5 27B蒸馏Claude 4.6 Opus推理能力,兼顾高质量输出与低门槛部署

近年来,大模型在推理能力和效率上不断进步。Jackrong于2026年3月开源了高性能推理模型Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled,该模型结合了先进的推理能力,显著提升了复杂问题的解决能力,支持流式对话生成,适用于科研、编程和教育等领域,提供个性化的智能对话支持。

在线教程丨Qwen3.5 27B蒸馏Claude 4.6 Opus推理能力,兼顾高质量输出与低门槛部署

HyperAI超神经
HyperAI超神经 · 2026-04-03T07:16:39Z
AI 数学推理新纪元:SAIR Foundation 正式启动“数学蒸馏挑战赛”

SAIR Foundation于2026年3月14日启动“数学蒸馏挑战赛”,旨在突破AI逻辑瓶颈,提升机器推理能力。比赛提供2200万道代数题,参赛者需编写压缩的“策略指南”以提高弱模型的准确率,分为两个阶段,欢迎全球学者和爱好者参与。

AI 数学推理新纪元:SAIR Foundation 正式启动“数学蒸馏挑战赛”

量子位
量子位 · 2026-03-14T12:45:52Z
搭建大模型 API 中转并用于国内数据蒸馏:基于 sub2api 的部署

本文介绍了基于sub2api的部署方案,适合个人开发者和小团队,旨在统一接入大模型服务并提供API接口。内容包括环境配置、部署路径、验证方法及运维注意事项,强调使用Docker进行快速部署,以确保数据清洗和调用管理的高效性。

搭建大模型 API 中转并用于国内数据蒸馏:基于 sub2api 的部署

QingHao's Blog
QingHao's Blog · 2026-03-08T16:38:24Z
1600万次偷跑曝光!Deepseek与Minimax如何偷偷蒸馏Anthropic?

Anthropic指控三家中国大模型公司(Deepseek、Kimi、Minimax)通过蒸馏其模型并提供日志和交互数据作为证据。蒸馏是否构成抄袭存在争议,Anthropic认为这些公司通过混淆账号和IP地址进行不当行为。尽管Deepseek V4尚未发布,相关指控已引发关注,未来可能面临法律后果。

1600万次偷跑曝光!Deepseek与Minimax如何偷偷蒸馏Anthropic?

硕鼠的博客站
硕鼠的博客站 · 2026-02-26T00:51:04Z
让 Anthropic 破防的「蒸馏」风波,美国 AI 大牛泼冷水:中国 AI 成功不靠走捷径

Anthropic 指控三家中国 AI 实验室通过虚假账号蒸馏其 Claude 模型。专家 Lambert 认为此事并不严重,强调蒸馏与强化学习的区别,指出蒸馏并非捷径,真正的创新依赖于强化学习。

让 Anthropic 破防的「蒸馏」风波,美国 AI 大牛泼冷水:中国 AI 成功不靠走捷径

爱范儿
爱范儿 · 2026-02-25T12:27:03Z
Claude API删除提示词后自称是深度求索的DS 也是蒸馏开源模型而来?

Anthropic 指责其他公司蒸馏 Claude 模型,但自己也使用开源模型进行训练,引发网友质疑其双标行为。尽管开源训练没有问题,但其闭源做法引发争议。

Claude API删除提示词后自称是深度求索的DS 也是蒸馏开源模型而来?

蓝点网
蓝点网 · 2026-02-25T03:29:55Z
Anthropic指控DeepSeek及其他中国公司利用Claude训练其人工智能

Anthropic指控DeepSeek等三家中国AI公司滥用其Claude AI模型,创建24,000个虚假账户并进行1600万次交流。尽管“蒸馏”是合法的训练方法,Anthropic警告其可能被用于非法目的,助长专制政权的网络攻击和监控。

Anthropic指控DeepSeek及其他中国公司利用Claude训练其人工智能

The Verge
The Verge · 2026-02-23T20:22:55Z
大模型蒸馏:小型快速AI的实用指南

大模型在基准测试中表现优异,但推理成本高。模型蒸馏通过知识转移压缩模型,既保持准确性又降低成本,适合边缘设备。本文介绍了蒸馏的原理、应用场景及与其他优化技术的结合,以提高LLM应用的效率和性能。

大模型蒸馏:小型快速AI的实用指南

Redis Blog
Redis Blog · 2026-02-11T00:00:00Z
FLUX.2‑klein‑4B:步数蒸馏实现 4 步亚秒级图像生成,在消费级 GPU 上体验实时交互;Vehicles OpenImages 数据集:专注车辆检测与定位

黑森林实验室发布的FLUX.2-klein-4B模型,通过步数蒸馏实现亚秒级推理,显存需求仅13GB,支持多种生成模式,提升了AI图像生成的实时交互能力。

FLUX.2‑klein‑4B:步数蒸馏实现 4 步亚秒级图像生成,在消费级 GPU 上体验实时交互;Vehicles OpenImages 数据集:专注车辆检测与定位

HyperAI超神经
HyperAI超神经 · 2026-02-02T08:33:47Z
生成1.8万年气候数据,英伟达等提出长距离蒸馏,仅需单步计算实现长期天气预报

AI天气预报模型通过生成合成气候数据,解决了长期预报中的数据稀缺问题。研究者提出的长距离蒸馏方法,利用自回归模型生成大量数据,训练出仅需单步计算的概率模型,显著提高了预报准确性,已达到与欧洲中期天气预报中心相当的水平。

生成1.8万年气候数据,英伟达等提出长距离蒸馏,仅需单步计算实现长期天气预报

HyperAI超神经
HyperAI超神经 · 2026-01-05T12:31:02Z
小猫都能懂的大模型原理 6 - 模型优化

本文介绍了大语言模型的优化方法,包括蒸馏、量化、超长上下文和混合专家。蒸馏通过大模型指导小模型以减小体积并保留能力;量化通过降低精度节省内存;超长上下文利用局部窗口和环形注意力优化计算;混合专家则选择性激活部分专家以减少计算量。这些方法有效提升了模型的效率和性能。

小猫都能懂的大模型原理 6 - 模型优化

UsubeniFantasy
UsubeniFantasy · 2025-12-25T08:00:51Z
流匹配模型的得分蒸馏

本文探讨了流匹配模型的得分蒸馏方法,以提高图像生成效率。通过推导,统一了高斯扩散与流匹配,并将得分身份蒸馏(SiD)扩展至预训练的文本到图像流匹配模型。实验结果表明,SiD在不同模型中有效,无需教师微调或架构更改,首次系统性证明了得分蒸馏在文本到图像流匹配模型中的广泛适用性。

流匹配模型的得分蒸馏

Apple Machine Learning Research
Apple Machine Learning Research · 2025-12-16T00:00:00Z
为什么模型蒸馏正在成为生产AI中最重要的技术

Nebius Token Factory的客户通过模型蒸馏技术提高搜索排名和语法纠正等任务的效率。该技术将大型模型的行为转移至小型模型,降低延迟和成本,同时保持准确性,越来越多地被行业采用,以实现高效的AI系统,满足经济稳定性需求。

为什么模型蒸馏正在成为生产AI中最重要的技术

KDnuggets
KDnuggets · 2025-12-09T18:02:15Z
FAQ

本文总结了AI领域的常见问题与解答,涵盖基础概念、技术原理及应用场景,帮助读者理解AI知识。讨论了量化与蒸馏的区别、模型优化技术、轻量模型部署及Hugging Face的使用方法。

FAQ

云原生
云原生 · 2025-09-23T13:24:25Z

本文探讨了RLDG(通过强化学习实现机器人通用策略蒸馏),强调其在生成高质量训练数据方面的优势。RLDG结合强化学习与基础模型的泛化能力,能够在复杂任务中超越人类示范,尤其在精确操作中表现出色。实验结果显示,RLDG策略在新场景中的成功率显著高于传统方法,展现了其在机器人操作中的潜力。

知识蒸馏RLDG:先基于精密任务训练RL策略(HIL-SERL),得到的RL数据去微调VLA,最终效果超越人类演示数据

结构之法 算法之道
结构之法 算法之道 · 2025-08-30T04:09:49Z

Mistral被指控涉嫌蒸馏DeepSeek模型,离职员工称其歪曲基准测试结果以误导公众。分析显示Mistral-small-3.2与DeepSeek-v3高度相似,且未标注蒸馏过程,缺乏透明性。此事件引发争议,Mistral在开源AI领域的地位受到影响,目前尚未回应。

被曝蒸馏DeepSeek还造假!欧版OpenAI塌方了

量子位
量子位 · 2025-08-14T08:19:13Z
用于设备导向语音检测的自适应知识蒸馏

设备导向语音检测(DDSD)是一项二元分类任务,旨在区分用户对语音助手的查询与背景对话。本文提出了一种新型知识蒸馏方法,通过从大型预训练声学编码器中转移知识,显著提升DDSD的准确性。实验结果显示,该方法在关键词和无关键词调用中,分别提高了26%和19%的错误率,并在不同模型架构中展现出良好的泛化能力。

用于设备导向语音检测的自适应知识蒸馏

Apple Machine Learning Research
Apple Machine Learning Research · 2025-08-08T00:00:00Z

PaddleMIX推出Fast-Diffusers工具箱,通过模型蒸馏和推理优化,将推理速度提升超过2倍。FLUX-Lightning模型实现4步快速生成,效果超越现有模型,结合CINN技术,推理时间缩短至1.66秒。未来将继续优化推理效率,推动扩散模型的应用。

PaddleMIX推出扩散模型推理加速Fast-Diffusers:自研蒸馏加速方法FLUX-Lightning实现4步图像生成

百度大脑
百度大脑 · 2025-07-30T12:58:45Z
蒸馏缩放法则

我们提出了一种蒸馏缩放法则,通过计算预算和学生与教师之间的资源分配来估计蒸馏模型的性能。研究表明,合理的计算资源分配可以最大化学生的性能。我们提供了两种关键场景的最佳蒸馏方案:已有教师和需训练教师的情况。在多个学生或已有教师的情况下,蒸馏优于监督学习;而在仅有一个学生且教师需训练时,监督学习更为有效。本研究加深了对蒸馏过程的理解。

蒸馏缩放法则

Apple Machine Learning Research
Apple Machine Learning Research · 2025-07-01T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码