E2LLM：用于长上下文理解和推理的编码器加长大型语言模型

本研究解决了大型语言模型在处理长上下文时面临的挑战，特别是在多轮对话、代码生成和文档摘要等任务中的表现。提出的E2LLM方法通过将长上下文分块、利用预训练文本编码器生成嵌入向量并通过适配器与解码器型LLM对齐，有效提升了长上下文理解能力。实验结果表明，E2LLM在长上下文场景中表现卓越，同时在效率、性能和与预训练模型的兼容性方面取得平衡，显著推动了长文本建模领域的发展。

本文介绍了处理较长序列时现代大型语言模型（LLMs）的上下文长度外推方法，通过测试发现线性标度是最佳方法，并且使用更长的标度在评估时可以获得进一步的收益。同时，发布了三个新的13B参数长上下文模型和相应的代码。

上下文长度代码大型语言模型线性标度编码器评估语言模型