BriefGPT - AI 论文速递 ·

LLaMA 简化：大型语言模型的简单深度修剪

💡 原文中文，约300字，阅读约需1分钟。

📝

内容提要

Compresso通过合作的剪枝算法和大型语言模型自身，成功将LLaMA-7B剪枝至5.4B，并在多个基准测试上获得更高分数。

🎯

关键要点

Compresso通过合作的剪枝算法和大型语言模型自身，成功将LLaMA-7B剪枝至5.4B。
在数据收集和训练成本昂贵的挑战下，Compresso学习最优的剪枝决策。
引入协同提示进一步增强了剪枝算法。
在阅读理解上超过LLaMA-7B2.62%。
在共同推理、阅读理解、MMLU和BBH基准测试上分别获得了2.21%、11.43%、7.04%和4.81%的更高分数。
Compresso的表现明显优于一次性剪枝基线。

🏷️

继续阅读

以GB/s速度读取UTF-8
本文讨论了在C语言中实现的UTF-8库及其在Perl中的应用。更新后的PerlIO::utf8_strict使用该库，但存在性能瓶颈。为此，作者实现了新的...
Agent 越改越乱之后，我用评测和轨迹把它拉回来了
本文探讨了AI代理如何通过评测结果和执行轨迹实现自我进化。代理利用结构化的“技能”手册逐步完成任务，但在复杂案例中常出现错误。为解决此问题，提出了一套五步...
让炼丹更科学一些（七）：步长调度与权重平均
精通炼丹的同学都知道，步长调度，或者说学习率调度（LR Schedule），对模型最终效果来说至关重要。我们在前几篇文章中已经推导过，即便只考虑SGD，终...
有玩家购买的V社蒸汽机开机20分钟就出现GPU故障断电几小时后又自动恢复
一位网友的Steam Machine在开机20分钟后出现GPU故障，显示死亡红线。多次断电未能解决，第二天重新通电后恢复正常。V社技术文档指出，氛围灯显示...
Codex 一键省 Token 大法，亲测有效
Codex 的 Token 消耗问题引起关注，Ponytail 项目通过优化代码和减少不必要的功能，显著降低了 Token 消耗。测试表明，Ponytai...
索尼粉丝发起请愿呼吁索尼继续生产实体游戏光盘但索尼已经将工厂改造另做他用
索尼粉丝发起请愿，呼吁保留实体游戏光盘，已收集近3万个签名。索尼计划从2028年起停止生产PS游戏光盘，转向光学微透镜业务，预计到2027年量产。尽管请愿...

内容提要

关键要点

标签

继续阅读