一分钟读论文:《把百亿模型装进手机:TIDE实现扩散语言模型跨架构蒸馏》
Micropaper
·
在线教程丨Qwen3.5 27B蒸馏Claude 4.6 Opus推理能力,兼顾高质量输出与低门槛部署
HyperAI超神经
·
搭建大模型 API 中转并用于国内数据蒸馏:基于 sub2api 的部署
QingHao's Blog
·
大模型蒸馏:小型快速AI的实用指南
Redis Blog
·
生成1.8万年气候数据,英伟达等提出长距离蒸馏,仅需单步计算实现长期天气预报
HyperAI超神经
·
小猫都能懂的大模型原理 6 - 模型优化
UsubeniFantasy
·
流匹配模型的得分蒸馏
Apple Machine Learning Research
·