微软推出BitNet v2框架,实现原生4bit激活值量化,充分利用新一代GPU计算能力,提升效率并减少内存带宽。通过H-BitLinear模块优化激活值分布,使低bit量化更有效。实验表明,4bit激活性能与8bit相当,部分任务表现更优。
完成下面两步后,将自动完成登录并继续当前操作。