FFN-SkipLLM:自适应前馈跳过的自回归解码中的隐藏宝石

📝

内容提要

通过使用 FFN-SkipLLM 方法,可以减少 FFN 块数量来提高自回归解码速度,并在知识密集型生成任务上保持较好性能。

➡️

继续阅读