小红花·文摘

LongLoRA是一种高效的微调方法，能够在有限的计算成本下扩展大型语言模型的上下文大小。研究提出的新型上下文压缩方法显著减少了内存占用，同时保持了性能。实验表明，选择性上下文方法可以降低推理时间和内存使用率。LIConBench基准测试评估了长上下文模型的表现，发现现有模型在处理长文本时仍面临挑战。