本研究提出了一种复合投影剪枝方法,以解决大语言模型在硬件部署中的高计算和内存需求。实验结果表明,该方法使马赛克系统速度提升7.19倍,困惑度降低84.2%,准确性提高31.4%。
完成下面两步后,将自动完成登录并继续当前操作。