本研究提出了一种新的动态草稿长度策略SVIP,旨在解决投机解码中固定草稿长度的问题。SVIP根据草稿词元分布的熵自适应调整草稿长度,实验结果表明其在主要基准测试中可实现最高20%的加速效果。
完成下面两步后,将自动完成登录并继续当前操作。