FR-Spec: 通过频率排名的推测采样加速大词汇量语言模型
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出FR-Spec框架,解决了大词汇量语言模型的低效率问题,通过压缩词汇空间和优化候选选择,减少了75%的计算开销,并在多个数据集上实现了1.12倍的加速。
🎯
关键要点
- 本研究提出FR-Spec框架,解决了大词汇量语言模型的低效率问题。
- FR-Spec框架通过压缩词汇空间和优化候选选择,减少了75%的计算开销。
- 该方法在多个数据集上实现了1.12倍的加速。
- 保持了最终输出分布的一致性。
- 相较于最先进的EAGLE-2方法,FR-Spec框架表现更优。
➡️