本文提出了一种基于无标签数据的结构裁剪框架,旨在提高大型语言模型的推理效率并降低计算成本。通过重建技术和优化算法,实现了在不牺牲准确度的情况下对模型的有效剪枝,适用于资源受限设备,并在多个基准测试中表现出优越性能。
完成下面两步后,将自动完成登录并继续当前操作。