Apple Machine Learning Research ·

SeedLM：将大型语言模型权重压缩为伪随机生成器的种子

💡 原文英文，约200词，阅读约需1分钟。

📝

内容提要

大型语言模型（LLMs）在自然语言处理领域取得了突破，但因运行成本高而难以广泛应用。本文提出了一种新颖的后训练压缩方法SeedLM，通过伪随机生成器的种子编码和压缩模型权重，利用线性反馈移位寄存器生成随机矩阵，结合压缩系数重构权重块。SeedLM减少内存访问，提升内存密集型任务的速度，且无需校准数据，适用于多种任务。实验表明，SeedLM在4位和3位压缩下的零-shot准确率与最先进方法相当，并在FPGA测试中显示出显著加速效果。

🎯

关键要点

大型语言模型（LLMs）在自然语言处理领域取得了突破，但因运行成本高而难以广泛应用。
本文提出了一种新颖的后训练压缩方法SeedLM，通过伪随机生成器的种子编码和压缩模型权重。
SeedLM利用线性反馈移位寄存器生成随机矩阵，结合压缩系数重构权重块。
该方法减少内存访问，提升内存密集型任务的速度，且无需校准数据，适用于多种任务。
实验表明，SeedLM在4位和3位压缩下的零-shot准确率与最先进方法相当。
FPGA测试显示，SeedLM在模型规模增加时，4位压缩接近于FP16 Llama 2/3基线的4倍加速效果。

❓

延伸问答

SeedLM是什么？

SeedLM是一种新颖的后训练压缩方法，通过伪随机生成器的种子编码和压缩模型权重。

SeedLM如何提高内存密集型任务的速度？

SeedLM通过减少内存访问和利用空闲计算周期来加速内存密集型任务。

SeedLM的实验结果如何？

实验表明，SeedLM在4位和3位压缩下的零-shot准确率与最先进方法相当，并在FPGA测试中显示出显著加速效果。

SeedLM与其他压缩方法有什么不同？

与依赖校准数据的先进方法不同，SeedLM是无数据的，能够在多种任务中良好泛化。

SeedLM适用于哪些任务？

SeedLM适用于多种任务，因其无需校准数据且具有良好的泛化能力。

SeedLM在FPGA测试中的表现如何？

FPGA测试显示，SeedLM在模型规模增加时，4位压缩接近于FP16 Llama 2/3基线的4倍加速效果。

🏷️

继续阅读

为什么GPT-5.4、Claude和Gemini在基本的现实世界事实上无法达成一致
近期研究显示，五种大型语言模型在处理真实世界声明时，67%的情况下存在意见分歧，尤其在判断“真实”与“虚假”时表现不一致。研究强调开发团队需谨慎验证AI生...
DoorDash如何构建评估大型语言模型的测试系统
DoorDash开发了一种模拟和评估系统，以改善客户支持聊天机器人，成功解决了“幻觉”问题。该系统通过离线模拟生成真实客户对话，并自动评估聊天机器人的表现...
Elon Musk's Five-Step Work Method
The five-step process: First, make your requirements less dumb. Your requirem...
AI原生时代下，让世界适应Agent，而非教AI做人 | 港大黄超@AIGC2026
CLI更像是Agent的母语
15亿收购：3000A电流怎么送进芯片？把供电塞到它屁股底下
AI芯片面临供电危机，电流暴涨导致发热和电压跌落。解决方案是将供电单元移至芯片封装内部，以缩短电流路径。ADI以15亿美元收购Empower Semico...
告别 Jenkins UI：jk 让 AI Agent 也能操控 Jenkins
jk 是一款为 AI 编程代理设计的 Jenkins CLI 工具，简化了 Jenkins 操作流程。用户可以通过命令行直接触发构建、查看日志和处理输入步...