ASER: Activation Smoothing and Error Reconstruction for Quantization of Large Language Models
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出ASER算法,旨在解决大型语言模型的低位量化问题,通过误差重建和激活平滑来提升性能。实验结果表明,ASER在保持准确性的同时,能够有效地量化大型语言模型。
🎯
关键要点
- 本研究提出ASER算法,旨在解决大型语言模型的低位量化问题。
- ASER算法通过误差重建和激活平滑来提升模型性能。
- 实验结果表明,ASER能够在保持准确性的同时有效量化大型语言模型。
- ASER在最先进的量化算法中表现出竞争力。
➡️