机器之心 ·

把MLA和稀疏激活带到端侧！港科大广州和伦敦大学学院团队联合发布软硬协同设计的边缘语言模型PLM

💡 原文中文，约4100字，阅读约需10分钟。

📝

内容提要

PLM团队开发了一种新型边缘设备语言模型，结合MLA注意力机制和ReLU²激活函数，优化了计算效率和内存使用。该模型在多项任务中表现优异，适配多种硬件，展现出高效、低延迟的性能，推动了边缘设备AI应用的发展。

🎯

❓

PLM模型结合了MLA注意力机制和ReLU²激活函数，优化了计算效率和内存使用。

PLM在HumanEval中获得最高分，并在多个任务中表现优异，尤其在通用知识理解和数学任务中。

PLM通过模型与硬件的协同设计，优化了KV缓存和计算复杂度，从而解决了内存、算力和I/O的瓶颈问题。

PLM采用三阶段锻造策略，充分利用开源数据，达到企业级水平。

PLM模型适配了多种边缘设备，包括Snapdragon等芯片，展现出优于同层数模型的吞吐优势。

PLM的稀疏激活设计使得MLP层激活稀疏度达到90.9%，整体计算量减少26%，提高了计算效率。

🏷️

团队在处理重复支付时面临的后台挑战
现代支付系统表面简单，但重复交易的后台复杂性显著。文章探讨了构建重复支付系统时的七个挑战，包括管理支付计划、避免重复收费、优雅处理失败支付、保持系统状态一...
VoidZero团队已加入Cloudflare
VoidZero团队已加入Cloudflare，Vite及其相关项目将继续保持开源和中立。Cloudflare承诺投资100万美元支持Vite生态系统的维...
使用Scikit-LLM与开源语言模型
本文介绍如何使用Ollama本地托管的开源语言模型（如Llama 3、Mistral和Gemma）进行文本分类，避免支付API费用。内容包括Ollama的...
江波龙携全栈端侧AI存储应用参加COMPUTEX 2026
江波龙在COMPUTEX 2026展会上展示了全栈端侧AI存储新品，包括针对AI推理的AIDIMM和AILPBGA内存产品，解决了内存容量不足的问题。同时...
基于 Amazon ECS Fargate 和 Graviton 构建企业级多租户 AI Agent 平台：OpenClaw + Hermes 双 Agent 实践
AI Agent 从实验走向生产，企业需要让不同团队各跑独立实例且互不可见。本文介绍基于 Amazon ECS Fargate + Graviton 的轻...
第28期大数据师资培训班报名主页（Hadoop+Spark+实战案例班，暑假，泉州，2026年8月6日-13日）
第28期大数据师资培训班报名主页（Hadoop+Spark+实战案例班，暑假，泉州，2026年8月6日-13日 […]