本研究提出MagicPIG系统,利用局部敏感哈希(LSH)解决大语言模型KV缓存的瓶颈问题。MagicPIG在多种任务中显著减少注意力计算量,同时保持高准确率,解码速度提升1.9到3.9倍。
完成下面两步后,将自动完成登录并继续当前操作。