小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

该研究探讨了通过结构化剪枝技术提高大型语言模型的压缩效果和推理速度。采用稀疏剪枝方法,实验表明可实现20倍的参数压缩而不损失性能。此外,提出了无标签数据的剪枝框架和新型BlockPruner方法,显著提升了模型的部署效率和任务性能。

STUN:结构化先行后非结构化的可扩展MoE剪枝

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-10T00:00:00Z

本文介绍了一种基于张量分解的卷积层参数压缩方法,在CIFAR-10数据集上实现了80倍的网络压缩和1.1%的精度损失。研究表明,张量分解显著减少了模型大小和能耗,提升了神经网络在边缘设备上的应用效果。

卷积模型的张量网络可压缩性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-21T00:00:00Z

深度神经网络中的隐式神经表示(INR)是一种前景数据压缩技术。提出了一种基于专家组混合理论的新型隐式神经压缩方法MoEC,通过自动分配INR给场景中的3D点,实现了与现有方法相比的最新研究成果。

资源有限设备中的快速隐式神经表示图像编解码器

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-23T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码