量子位 ·

手机实现GPT级智能，比MoE更极致的稀疏技术：省内存效果不减｜对话面壁&清华肖朝军

💡 原文中文，约4400字，阅读约需11分钟。

📝

内容提要

面壁智能与清华的CFM技术通过神经元级稀疏激活，提高了模型参数效率，降低了资源消耗，适合手机端应用。与MoE相比，CFM在稀疏化和动态性上更为优越，能够根据任务需求灵活激活神经元。

🎯

关键要点

面壁智能与清华的CFM技术通过神经元级稀疏激活，提高了模型参数效率，降低了资源消耗，适合手机端应用。
CFM技术相比MoE在稀疏化和动态性上更为优越，能够根据任务需求灵活激活神经元。
CFM的稀疏粒度更细，强调神经元级别的稀疏，适合端侧应用。
MoE的稀疏粒度是专家级别，不适合端侧，且动态性较弱。
当前非transformer架构的探索主要集中在效率上，而transformer仍是效果最好的架构。
小模型的定义尚不明确，端侧小模型可能在2-3B的范围内。
智能的本质可能与学习能力和抽象能力相关，而不仅仅是压缩。
面壁智能的小模型在手机、电脑和智能家居等多个端侧场景中应用广泛。
FP8等低精度计算在精度优化方面需要设计以保证效果。
长文本推理和创新能力是未来AI发展的重要方向。

❓

延伸问答

CFM技术的核心优势是什么？

CFM技术通过神经元级稀疏激活，提高了模型参数效率，降低了资源消耗，适合手机端应用。

CFM与MoE的主要区别是什么？

CFM的稀疏粒度更细，强调神经元级别的稀疏，动态性强于MoE，能够根据任务需求灵活激活神经元。

小模型的定义是什么？

小模型的定义尚不明确，但在端侧应用中，通常认为2-3B的模型算作小模型。

CFM技术如何影响手机端应用？

CFM技术提高了参数效率，降低了内存占用，使得大模型能够在手机等资源有限的设备上有效运行。

未来AI发展的重要方向是什么？

长文本推理和创新能力是未来AI发展的重要方向。

CFM技术在资源消耗方面有什么优势？

CFM技术通过神经元级稀疏激活，显著降低了资源消耗，适合在内存有限的设备上使用。

🏷️

继续阅读

Cox Media因虚假宣传被罚款，声称通过用户手机监听其对话
Cox Media及其合作公司因虚假宣传被罚款93万美元。美国联邦贸易委员会指出，这些公司并未实际监听用户对话，而是通过高价转售其他数据经纪人的电子邮件列表进行广告投放。
AI助力跨境增长：京点点Oxygen Vision 跨境套图AI生成技术实践与展望
京东推出的“京点点 Oxygen Vision”利用AI技术解决跨境电商商家在商品视觉创作中的痛点，降低成本并提高效率。该系统可快速生成符合多平台规范的商...
卡帕西Anthropic最新头衔：技术员工（MTS）
卡帕西在Anthropic的职称为“技术员工”（MTS），引发热议。尽管MTS头衔看似普通，薪资却高达30万至53万美元。该制度旨在防止猎头挖人、促进文化...
摩托罗拉手机被发现劫持亚马逊添加返利代码尚不清楚是故意的还是被黑
摩托罗拉手机的Smart Feed应用被发现劫持亚马逊，强制用户在启动亚马逊时先打开浏览器加载返利链接。该行为可能是内部人员所为，因为使用的域名刚注册3天...
荣耀手机广泛出现截图时存储空间不足问题官方确认是谷歌推送的更新有问题
荣耀手机用户在截图时出现“存储空间不足”的提示，官方确认此问题与谷歌更新有关，并非真实存储不足。该问题主要影响海外用户，荣耀正在与谷歌调查并修复。建议用户...
荣耀600系列手机发布：4K闪光微单Live，国补价2294.15元起
荣耀600系列手机发布，主打“幸运星”设计，具备全焦段4K Live直出、8600mAh电池及护眼技术。推出Pro、超级、元气版，售价2294.15元起，...