量子位 ·

32倍压缩率下性能反超25个点！破解长文本压缩「翻车」难题 | ICLR 2026

💡 原文中文，约2100字，阅读约需5分钟。

📝

内容提要

COMI团队提出了一种新型长文本压缩方法，通过边际信息增益（MIG）优化相关性与多样性，解决了高压缩率下性能下降的问题。在32倍压缩下，该方法显著提升了模型推理能力，确保多样化信息的保留，推动了大模型的轻量化与实用化。

🎯

关键要点

COMI团队提出了一种新型长文本压缩方法，通过边际信息增益优化相关性与多样性。
现有压缩方法在高压缩率下性能下降，主要因为只关注相关性而忽略多样性。
高质量压缩需要同时优化与查询的相关性和信息单元间的多样性。
COMI框架通过边际信息增益指标与粗到细压缩策略，在32倍压缩率下保留多样化的关键证据链。
边际信息增益（MIG）指标用于权衡相关性与冗余性，避免信息内卷。
COMI采用两阶段策略：粗粒度组重分配和细粒度token融合，确保压缩后的信息价值最大化。
在多个数据集上，COMI在32倍压缩下表现优越，显著提升模型推理能力。
COMI不仅实现了高压缩率下的性能提升，还提高了推理速度，为工业级部署提供了可能。
真正的高质量压缩是通过消除冗余干扰实现信息提纯，而非简单的删减。

🏷️

继续阅读

过年回老家的一点味觉记录
今年回镇江，我在西津渡的面店尝了长鱼面，汤偏稠且有些黏。还喝了香醋可乐，味道不协调。除夕在全聚德吃了烤鸭，鸭皮酥脆但油脂感重。整体体验没有惊喜，记忆更深刻。
三个和尚没水喝！OpenAI星际之门搁浅，一年过去压根没动工
OpenAI的星际之门项目进展缓慢，团队不完整，数据中心尚未开工。与软银和甲骨文的合作存在分歧，而马斯克的xAI项目则快速推进，提出了太空算力的概念。数据...
[Beta] OpenClaw v2026.2.22-beta.1发布针对Telegram机器人进行多种优化
人工智能项目OpenClaw发布v2026.2.22-beta.1版，优化了Telegram机器人功能，新增内置更新器并支持Mistral AI模型。修复...
打包ROCm环境的相关Wheel方便后续使用 - 程序设计实验室
本文介绍了如何从AMD的ROCm官方源下载并打包Wheel格式的Python库。Wheel是预编译的二进制文件，安装快速且方便。作者通过命令行提取了多个R...
霓虹岛国の北海道印象：函馆
作者在北海道函馆体验了一场梦幻之旅，探索柯南取景地，欣赏夜景，品尝海鲜，感受温泉文化。尽管天气异常，函馆的魅力依然吸引人，旅行圆满结束。
谷歌反重力封号风波引起OpenClaw创始人关注可能会考虑移除对谷歌的支持
谷歌近期无预警封禁大量反重力账号，引发用户不满。OpenClaw AI创始人考虑撤回对谷歌反重力的支持，认为谷歌的做法过于严苛且缺乏通知。用户在多个平台讨...

32倍压缩率下性能反超25个点！破解长文本压缩「翻车」难题 | ICLR 2026

内容提要

关键要点

标签

继续阅读