本文介绍了一种名为FBI-LLM的新方法,用于训练二值化大语言模型。该方法使用自回归蒸馏从头开始训练二值化模型,性能接近全精度模型。作者通过实验证明了该方法的有效性,并展示了二值化模型在生成任务上的潜力。该方法可减少存储需求,提高计算速度和能源效率。
完成下面两步后,将自动完成登录并继续当前操作。