小红花·文摘

InfoQ ·

本研究提出了一种虚拟机，解决了低精度计算方法对非二进制权重位宽的支持问题，显著提升了大语言模型（LLM）服务的性能。该虚拟机能够处理任意位宽的低精度数据类型，实验结果表明其性能优于现有低精度内核，推动了LLM应用的可行性。

BriefGPT - AI 论文速递 ·