BriefGPT - AI 论文速递 - 2023-08-23T00:00:00Z

IncreLoRA：增量参数分配方法用于参数高效微调

提出了一种增量参数分配方法 IncreLoRA，通过根据每个模块的重要性得分，在训练期间自适应地添加可训练参数，以应对有限训练条件下参数剪枝的限制，实现更高的参数效率，并在低资源设置下显著优于基准方法。

LoRAPrune是一个用于高性能大规模预训练模型的高效微调和部署的框架。它使用PEFT感知的剪枝标准和基于LoRA的梯度值和梯度重要性估计，通过迭代剪枝过程删除冗余参数，实现高精度和高压缩比。实验结果表明，该方法在各个任务中达到了最先进的结果，并在VTAB-1k基准测试中，使用可训练参数的仅0.76％，比幅度和移动剪枝方法高5.7％和4.3％，同时保留微调优点，实现与PEFT方法可比较的性能。

LoRAPrune 剪枝大规模预训练模型高压缩比高性能

相关推荐去reddit讨论

分享给好友

APIGPT

沉浸式翻译 immersive translate

相关推荐
编辑精选

热榜 Top10

标签 Top100

ai 语言模型神经网络 linux llm 开源微软 .net python 数据集人工智能算法 google apple 扩散模型安全机器学习苹果 java 深度学习 android 游戏 rust postgresql 建模机器人漏洞谷歌 ios openai windows mysql c# 大模型 spring 开发者函数 api gpt github 教程 chatgpt microsoft 卷积数据库 windows 11 nvidia web mongodb 强化学习内存 iphone 浏览器 security docker 插件 cloud sql 编码器大语言模型 wordpress 基准测试联邦学习程序员欧盟黑客 mac 总结 postgres 流量入门解决方案 sora 无监督 generative ai c++ 一致性工程师点云 spring boot 网络安全视图 redis pdf 重建 swift 硬件单片机接口前端多智能体 kubernetes 容器 visual studio git 面试 cve 源码马斯克 tiktok

赞助商

我也要赞助

eolink	观测云
Dify.AI	LigaAI

推荐或自荐

意见或建议