BriefGPT - AI 论文速递 · 2024-04-05T00:00:00Z FFN-SkipLLM:自适应前馈跳过的自回归解码中的隐藏宝石 📝 内容提要 通过使用 FFN-SkipLLM 方法,可以减少 FFN 块数量来提高自回归解码速度,并在知识密集型生成任务上保持较好性能。 阅读原文 生成长图 分享链接 已复制链接