量子位 ·

Scaling Law不是唯一视角！清华刘知远团队提出大模型“密度定律”：模型能力密度100天翻番

💡 原文中文，约2900字，阅读约需7分钟。

📝

内容提要

清华大学刘知远团队提出了大模型的“密度定律”，指出模型能力每100天翻一倍，揭示了AI时代电力、算力与智力的快速增长。研究表明，模型推理成本显著降低，新模型不断涌现，推动了端侧智能的发展。

🎯

关键要点

清华大学刘知远团队提出大模型的密度定律，模型能力每100天翻一倍。
密度定律揭示了AI时代电力、算力与智力的快速增长趋势。
能力密度是衡量大模型性价比的新指标，定义为有效参数量与实际参数量的比值。
研究发现，模型推理成本显著降低，推理开销随时间指数级下降。
自ChatGPT发布以来，大模型能力密度加速增强，密度增强速度增加50%。
芯片电路密度与模型能力密度的交汇揭示了端侧智能的巨大潜力。
现有模型压缩技术未必能提高模型密度，后训练不充分可能导致能力密度下降。
模型高性价比的有效期不断缩短，盈利窗口短暂。
AI时代的三大核心引擎——电力、算力与智力，密度都在快速增长。
随着模型能力密度的提升，AI技术的可持续发展将有无限可能，推动“AI无处不在”的愿景。

❓

延伸问答

什么是大模型的密度定律？

大模型的密度定律是指模型能力每100天翻一倍，揭示了AI时代电力、算力与智力的快速增长趋势。

能力密度如何定义？

能力密度定义为有效参数量与实际参数量的比值，用于衡量大模型的性价比。

模型推理成本的变化趋势是什么？

模型推理成本随时间指数级下降，例如GPT-3.5的推理成本在2022年为20美元，而Gemini-1.5-Flash在2024年降至0.075美元。

ChatGPT发布后，模型能力密度有什么变化？

自ChatGPT发布以来，大模型能力密度加速增强，密度增强速度增加了50%。

现有的模型压缩技术对能力密度有什么影响？

现有的模型压缩技术未必能提高模型密度，后训练不充分可能导致能力密度下降。

AI时代的三大核心引擎是什么？

AI时代的三大核心引擎是电力、算力与智力，它们都在快速增长。

🏷️

继续阅读

智源&清华合作成果登上Science：脑科学多模态基础模型Brainμ支撑揭示“记忆-睡眠”调控的神经机制
研究表明，睡眠中的记忆重激活影响睡眠动态，提供了“记忆-睡眠”双向作用的新证据。智源研究院与清华大学的研究发现，负向记忆再激活加剧睡眠碎片化，而正向记忆再...
有人靠CPU把AI算力密度卷到了新高度
英特尔推出新技术以应对Agentic AI的算力焦虑，提升AI算力密度，推动数据中心和AI的发展。
从超级个体到超级团队，腾讯云发布WorkBuddy企业版
腾讯云在AI产业应用大会上发布了WorkBuddy企业版及办公智能体套件，旨在帮助企业实现AI转型。该套件提供数字员工、人机协作和团队管理功能，提升工作效...
基于220种海洋细菌，科学家用基因组尺度模型重构异养微生物分类体系，挖出8类代谢菌群
研究揭示海洋异养微生物的代谢生态位，打破传统的富营养型与寡营养型二分法，提出8类代谢菌群。通过基因组分析，阐明其生长规律与资源竞争，推动全球碳循环研究，为...
微软MAI模型发布深度解读：前沿微调成企业AI护城河
微软在2026年推出的MAI系列模型标志着其从依赖OpenAI转向自建AI模型的战略转变。MAI模型涵盖推理、编码、图像和语音等多个领域，特别是通过“前沿...
删除了100条Obsidian笔记：信号密度更强，资料库更聪明了
作者通过清理2100条Obsidian笔记，提出“信号密度”概念，强调减少噪音比增加信息更重要。有效笔记应包含个人思考，纯收集信息会降低AI效率。提供了四...