UniMem：面向长上下文大型语言模型的统一视图

提出了 UniMem 框架，将现有的长上下文处理方法从记忆增强的角度进行统一；通过分析 Transformer-XL、Memorizing Transformer、RMT 和 Longformer 等方法，揭示它们的设计原理和优势；基于这些分析，提出了整合这些算法优势的创新方法 UniMix，并通过实验证明了 UniMix 在处理长上下文方面具有比基准模型更低的困惑度。

提出了一种新的语义压缩方法，使得基于Transformer的大型语言模型适用于长度为原先的6-8倍的文本，无需显著计算开销或微调。该方法通过源编码概念和预训练模型，减少长输入的语义冗余后再传递给LLM进行下游任务。实验结果表明，该方法有效地扩展了LLM在问答、摘要、少样本学习和信息检索等任务中的上下文窗口，并且能够保持生成文本的流畅性。

LLM Transformer 上下文窗口大型语言模型视图语义压缩方法