机器之心 ·

LLM最大能力密度100天翻一倍！清华刘知远团队提出Densing Law

💡 原文中文，约3100字，阅读约需8分钟。

📝

内容提要

近期，AI界对大模型的Scaling Law产生分歧。清华大学提出的密度定律表明，大模型能力密度每100天翻倍，推论模型推理开销和能力密度加速下降，揭示端侧智能潜力，强调需持续探索大模型的科学建设路径。

🎯

关键要点

AI界对大模型的Scaling Law产生分歧，部分观点认为其已到头。
清华大学提出的密度定律表明，大模型能力密度每100天翻倍。
密度定律推论模型推理开销随时间指数级下降。
大模型能力密度正在加速增强，芯片电路密度与模型能力密度持续增强。
无法仅依靠模型压缩算法增强模型能力密度。
模型高性价比有效期不断缩短，盈利窗口短暂。
密度定律揭示LLM进入新发展阶段，电力、算力与智力密度快速增长。
AI计算从中心端到边缘端的分布式特性协同高效发展，推动AI无处不在的愿景。

❓

延伸问答

密度定律是什么？

密度定律是清华大学提出的，表明大模型能力密度每100天翻倍，推论模型推理开销随时间指数级下降。

密度定律对大模型的影响是什么？

密度定律揭示了大模型能力密度加速增强，意味着用更少的参数可以实现更强的性能，推动端侧智能的发展。

大模型的推理开销如何变化？

根据密度定律，模型推理开销随时间指数级下降，例如GPT-3.5的推理成本在短时间内大幅降低。

如何评估大模型的能力密度？

能力密度定义为有效参数大小与实际参数大小的比率，通过参考模型的性能来计算。

模型压缩算法对能力密度的影响如何？

研究表明，无法仅依靠模型压缩算法来增强模型能力密度，很多压缩模型的密度低于原始模型。

未来大模型的发展趋势是什么？

未来大模型将进入密度至上的新发展阶段，电力、算力与智力密度将快速增长，推动AI技术的可持续发展。

🏷️

继续阅读

VoidZero团队已加入Cloudflare
VoidZero团队已加入Cloudflare，Vite及其相关项目将继续保持开源和中立。Cloudflare承诺投资100万美元支持Vite生态系统的维...
使用Scikit-LLM与开源语言模型
本文介绍如何使用Ollama本地托管的开源语言模型（如Llama 3、Mistral和Gemma）进行文本分类，避免支付API费用。内容包括Ollama的...
LeCun 10亿押注的方向，全球领先视觉大模型团队早已布局
视启未来团队专注于开发隐空间世界模型，推动AI从“看见”向“预见”转变。创始人张磊指出，理解因果关系和物理规律至关重要。团队通过提升物体理解能力，推出全球...
研究人员不满微软安全团队的做法公开爆出VS Code漏洞可窃取私有凭证
安全研究员Ammar Askar披露了Visual Studio Code中的高危漏洞，该漏洞可窃取GitHub OAuth Token，导致开发者仓库受...
网络设备曾经看起来像小型笔记本电脑，但现在它们变得更加个性化
近年来，网络设备（cyberdecks）向个性化发展，许多DIY爱好者在社交媒体上展示将计算机组件隐藏在手袋、玩具等物品中的创意。这些迷你Linux计算机...
PATH计划提升与行业对接的人工智能培训和职业机会
麻省理工学院与乔治亚州立大学合作推出PATH计划，旨在通过建立州级中心，连接大学、社区学院、行业和政府，提供与行业对接的人工智能培训。该计划强调实践学习，...