32倍压缩率下性能反超25个点!破解长文本压缩「翻车」难题 | ICLR 2026
💡
原文中文,约2100字,阅读约需5分钟。
📝
内容提要
COMI团队提出了一种新型长文本压缩方法,通过边际信息增益(MIG)优化相关性与多样性,解决了高压缩率下性能下降的问题。在32倍压缩下,该方法显著提升了模型推理能力,确保多样化信息的保留,推动了大模型的轻量化与实用化。
🎯
关键要点
- COMI团队提出了一种新型长文本压缩方法,通过边际信息增益优化相关性与多样性。
- 现有压缩方法在高压缩率下性能下降,主要因为只关注相关性而忽略多样性。
- 高质量压缩需要同时优化与查询的相关性和信息单元间的多样性。
- COMI框架通过边际信息增益指标与粗到细压缩策略,在32倍压缩率下保留多样化的关键证据链。
- 边际信息增益(MIG)指标用于权衡相关性与冗余性,避免信息内卷。
- COMI采用两阶段策略:粗粒度组重分配和细粒度token融合,确保压缩后的信息价值最大化。
- 在多个数据集上,COMI在32倍压缩下表现优越,显著提升模型推理能力。
- COMI不仅实现了高压缩率下的性能提升,还提高了推理速度,为工业级部署提供了可能。
- 真正的高质量压缩是通过消除冗余干扰实现信息提纯,而非简单的删减。
➡️