小红花·文摘

本研究提出了一种高效的一周期结构剪枝框架，旨在解决多阶段训练中的高计算成本和性能下降问题。通过优化子网络搜索，该方法在多个数据集上实现了先进的准确率，并提高了训练效率。

One-Cycle Structured Pruning with Stability-Driven Structure Search

BriefGPT - AI 论文速递 ·

本文介绍了多种大型语言模型的结构剪枝方法，包括LLM-Pruner、FLAP、NutePrune、MoreauPruner和BlockPruner。这些方法旨在在保持性能的同时减少模型规模和内存消耗，提高推理速度，适用于资源受限的硬件环境。研究表明，这些剪枝技术在零样本任务和下游任务中表现出色，能够有效支持大型语言模型的本地和边缘设备部署。

KVPruner：用于更快和更节省内存的大型语言模型的结构性剪枝

BriefGPT - AI 论文速递 ·