微软开源的三进制LLM BitNet b1.58 2B4T,参数达到2B,内存仅需0.4GB,能在单CPU上高效运行。该模型采用三元值{-1, 0, 1}存储权重,计算效率高,解码延迟仅29ms,能耗低至0.028J,性能优于同类模型。
微软亚洲研究院发布了新的1-bit大语言模型BitNet b1.58,比传统的FP16 LLM在速度、内存使用和能耗方面更优。BitNet b1.58使用三进制表示参数,推理速度比FP16 LLM快2-4倍,内存使用减少3-4倍,能耗比FP16 LLM低70倍以上。该模型降低了存储和计算成本,提高了性能,适用于移动设备、物联网和云计算。然而,BitNet b1.58仍存在模型容量和训练难度问题。
完成下面两步后,将自动完成登录并继续当前操作。