小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出了一种新的结构化剪枝框架SPAP,旨在优化大型语言模型的计算和内存需求。SPAP通过混合整数优化和交替最小化算法,解决了性能下降和微调成本高的问题,实验证明其在推理速度和内存效率上优于现有方法。

SPAP:通过交替优化和惩罚方法进行结构化剪枝

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-06T00:00:00Z

本文提出了一种新的两阶段框架2SSP,用于大语言模型的结构化剪枝,结合宽度和深度剪枝策略。该方法在多种稀疏率下显著提升了语言建模和下游任务的性能,并显著缩短了剪枝时间。

2SSP: A Two-Stage Framework for Structured Pruning of Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-29T00:00:00Z

研究提出了一种层级压缩方法,通过结构化剪枝技术如LLM-Pruner、Compresso和FLAP,解决大型语言模型在部署时的参数和计算开销问题。这些方法提升了模型性能和效率,适用于多任务求解和语言生成,减少存储需求并提高推理速度,支持自然语言处理应用的普及。

无须重新训练的高精度基础模型剪枝

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-21T00:00:00Z

该研究探讨了通过结构化剪枝技术提高大型语言模型的压缩效果和推理速度。采用稀疏剪枝方法,实验表明可实现20倍的参数压缩而不损失性能。此外,提出了无标签数据的剪枝框架和新型BlockPruner方法,显著提升了模型的部署效率和任务性能。

STUN:结构化先行后非结构化的可扩展MoE剪枝

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-10T00:00:00Z

该研究设计了一种稀疏训练过程,通过考虑激活的最终位置来诱导半结构化激活稀疏性。在图像分类和目标检测任务中评估,结果显示该方法在ResNet18模型上实现了1.25倍的加速,仅有1.1%的最小精度降低。与结构化剪枝方法相结合,该方法在延迟和准确性之间取得了平衡,优于仅采用结构化剪枝技术的模型。

大规模神经架构的反向传播压缩:结构化激活剪枝

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-28T00:00:00Z

该研究评估了基于结构化剪枝在多语言预训练语言模型上的设置、算法和效率,并提出了一种动态稀疏化的方法。实验结果填补了关于多语言预训练模型上的结构化剪枝研究的空白,为未来的研究提供启示。

动态 ASR 路径:多语音 ASR 模型高效剪枝的自适应遮罩方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-22T00:00:00Z

通过结构化剪枝方法,实现了高稀疏度和低FLOPs的网络优化,同时在分类和分割问题上表现优于先进水平,避免了昂贵的稀疏矩阵运算。

结构化剪枝中连续松弛的泛化

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-28T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码