本研究提出了BitStack,一种无训练的权重压缩方案,旨在解决大语言模型在本地设备上的内存限制问题。该方法动态调整模型大小,实现内存使用与性能的平衡,实验结果显示在极端压缩比下仍能超越现有基准。
完成下面两步后,将自动完成登录并继续当前操作。