小红花·文摘

本文探讨了大语言模型（LLMs）在资源受限环境中的优化问题，综述了知识蒸馏、模型量化和模型剪枝等压缩技术，提供了有效的解决方案和成功案例，为研究者和从业者在边缘设备上优化LLM提供参考。

Optimizing LLMs for Resource-Constrained Environments: A Survey of Model Compression Techniques

BriefGPT - AI 论文速递 ·

本研究提出了一种基于最小最大优化的掩膜学习新范式，旨在应对大语言模型（LLM）规模增长带来的部署与推理挑战，确保剪枝模型的结构均匀性并保持高性能。

MaskPrune: Mask-based Hierarchical Uniform Structure Pruning for Large Language Models

BriefGPT - AI 论文速递 ·

该研究提出了一种名为NeuroAl的新方法，解决了传统模型剪枝中因重新训练带来的不便。通过动态调整稀疏比例，最大化神经元对齐，显著降低计算资源消耗，无需重新训练模型。

Zeroth-Order Adaptive Neuron Alignment Pruning without Re-Training

BriefGPT - AI 论文速递 ·

本研究提出了一种高效的联邦学习方法，针对工业物联网中的多变量时间序列分析。通过模型剪枝技术，显著降低了处理、存储和通信复杂度，实现超过99.7%的压缩率，且性能损失不足1.18%。该方法有效解决了异常和缺失数据的问题，展现了联邦学习的潜力。

Resource-Efficient Federated Learning for Multivariate Time Series Analysis in Industrial IoT

BriefGPT - AI 论文速递 ·

本文探讨了在资源受限环境下，通过模型剪枝技术压缩神经网络的方法，包括逐渐剪枝和自适应结构化裁剪等。这些方法在保持高精度的同时显著减少了模型参数和计算复杂度，研究表明在多个数据集上表现优越，提升了深度神经网络的性能和效率。

深度状态空间模型的层自适应状态剪枝

BriefGPT - AI 论文速递 ·

本文介绍了多种针对Transformer架构的模型剪枝方法，包括LeOPArd、GRAIN、GBLM-Pruner、FinerCut、BlockPruner和MINI-LLM。这些方法通过优化自注意力机制和参数剪枝，提高了计算速度，降低了能源消耗，并在不牺牲性能的情况下减少了模型大小，提升了推理效率，适用于边缘设备和多任务场景。

超越线性近似：一种新颖的注意力矩阵剪枝方法

BriefGPT - AI 论文速递 ·

本文探讨了在资源受限环境下通过模型剪枝压缩神经网络的方法，提出逐渐剪枝技术，能够在保持高精度的同时减少参数数量。研究表明，剪枝显著降低计算资源消耗，提高模型性能和可解释性，并对未来发展方向进行了综述和建议。

通过解释重新审视剪枝：优化归因方法以剪枝CNN和变换器

BriefGPT - AI 论文速递 ·

本文介绍了多种基于优化的模型剪枝方法，包括 ALPS、LLM-Pruner 和 LoRAPrune，旨在提升大型语言模型的效率和性能。ALPS 在稀疏模型上显著降低困惑度，LLM-Pruner 通过结构修剪保持多任务能力，而 LoRAPrune 则通过迭代剪枝最大化性能。此外，TextPruner 和 FLAP 也展示了在不重新训练的情况下有效压缩模型的能力。

基于凸优化的分层后训练修剪器应用于大型语言模型

BriefGPT - AI 论文速递 ·

DeepZero是一个基于ZO优化的深度学习框架，实现了与一阶优化相当的性能。其优点包括坐标梯度估计在训练准确性和计算效率上的优势，利用模型剪枝方法扩展稀疏DL先验信息的ZO训练协议，并通过特征重用和前向并行化方法提高ZO训练的实际实施。

DeepZero：扩展零阶优化以提升深度模型训练

BriefGPT - AI 论文速递 ·