BriefGPT - AI 论文速递 ·

EMS: Adaptive Evict-then-Merge Strategy for Head-wise KV Cache Based on Global-Local Importance

💡 原文英文，约100词，阅读约需1分钟。

📝

内容提要

本研究提出了一种名为EMS的新方法，以提高大规模语言模型中KV缓存的压缩效率。该方法结合全局与局部得分，更有效地识别令牌的重要性。实验结果表明，EMS在极端压缩比下仍能保持先进性能，降低困惑度，并显著提高多项任务的检索准确率。

🎯

🏷️

How the controller-runtime Cache Actually Works, and Why Your Controller Does Not Crash the API Server
Kubernetes has long been the default platform for distributed workloads, and ...
俄罗斯指控Telegram创始人协助(乌兰克)进行恐怖主义活动已发布国际通缉令
#行业资讯俄罗斯指控 Telegram 创始人帕维尔杜罗夫协助恐怖主义活动，目前已通过国际刑警组织向杜罗夫发出国际通缉令。俄罗斯称 Telegram 长...
高通和 IDC 说，智能眼镜会是手机之外，最重要的 AI 设备
AI 将会成功智能设备的基础能力。#欢迎关注爱范儿官方微信公众号：爱范儿（微信号：ifanr），更多精彩内容第一时间为您奉上。
CVPR 2026 | PixelDiT：用于图像生成的像素扩散变换器
潜空间建模已成为扩散 Transformer（DiT）的标准范式。然而，它依赖于一个两阶段的流程，其中预训练的自编码器会引入有损重建，导致误差累积并阻碍联...
中之杰智能发布德沃克X-Agent工业智能体“三剑客”产品矩阵
(全球TMT 2026年07月30日讯)浙江中之杰智能系统有限公司正式发布德沃克X-Agent工业智能体“三剑 […]
Lee Cronin's The Mummy
2026 年的木乃伊电影