量子位 ·

32倍压缩率下性能反超25个点！破解长文本压缩「翻车」难题 | ICLR 2026

💡 原文中文，约2100字，阅读约需5分钟。

📝

内容提要

COMI团队提出了一种新型长文本压缩方法，通过边际信息增益（MIG）优化相关性与多样性，解决了高压缩率下性能下降的问题。在32倍压缩下，该方法显著提升了模型推理能力，确保多样化信息的保留，推动了大模型的轻量化与实用化。

🎯

🔎

长文本压缩在高压缩率下常面临性能下降的问题，主要是因为现有方法过于关注相关性，忽视了信息的多样性。COMI框架通过边际信息增益（MIG）指标，成功解决了这一难题，确保在32倍压缩下仍能保留多样化的信息。这为大模型的轻量化和实用化提供了新的可能性。

COMI框架引入的边际信息增益（MIG）指标，能够有效权衡信息的相关性与冗余性。这一创新方法不仅提升了压缩后的信息质量，还避免了信息内卷现象，使得模型在处理长文本时更加精准。理解MIG的应用，有助于进一步优化文本处理技术。

COMI采用的粗到细自适应压缩策略，能够根据信息密度动态调整压缩率。这种方法确保了高价值信息的保留，同时减少冗余内容的干扰。这一策略的成功实施，展示了在高压缩率下实现高效推理的潜力，为未来的文本处理技术提供了重要参考。

❓

COMI团队通过边际信息增益（MIG）优化相关性与多样性，提出了一种新型的长文本压缩方法，解决了高压缩率下性能下降的问题。

现有方法主要关注相关性，忽略多样性，导致保留大量相似的冗余内容，造成信息内卷，影响模型性能。

MIG用于权衡相关性与冗余性，帮助优化压缩决策，确保保留与查询相关且多样化的信息。

COMI采用两阶段策略：粗粒度组重分配和细粒度token融合，确保压缩后的信息价值最大化。

在多个数据集上，COMI在32倍压缩下表现优越，显著提升了模型推理能力和速度，适合工业级部署。

高质量压缩是通过消除冗余干扰实现信息提纯，而非简单的删减，确保每一比特都承载多样化的信息价值。

🏷️