Towards Lossless Token Pruning in Late-Interaction Retrieval Models

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出了一种无损标记剪枝方法,以解决后交互神经信息检索模型(如ColBERT)在存储文档标记时的高内存需求。通过引入三种正则化损失和两种剪枝策略,确保在仅使用30%标记的情况下,模型性能得以保持。

🎯

关键要点

  • 本研究提出了一种无损标记剪枝方法,旨在解决后交互神经信息检索模型(如ColBERT)在存储文档标记时的高内存需求。
  • 通过引入三种正则化损失,确保模型在剪枝过程中保持性能。
  • 采用两种剪枝策略,使得在仅使用30%标记的情况下,模型性能得以维持。
➡️

继续阅读