本文提出了协调投机采样(HASS)方法,解决大语言模型解码中的接受率问题,通过协调训练与解码的目标和上下文,显著提高了接受率,无额外推理开销。实验结果显示在多个数据集上具有显著加速效果。
完成下面两步后,将自动完成登录并继续当前操作。