上下文学习中的记忆化

本研究首次揭示了上下文学习（ICL）中记忆化训练数据的机制，并探讨了记忆化与不同ICL模式（如零-shot、少-shot和多-shot）表现之间的相关性。研究发现，ICL在大多数情况下显著提高对记忆的利用，特别是在少-shot情境中，记忆化程度达到约40%时，性能显著提升，这提醒我们需重新考虑大语言模型在ICL中的泛化能力与记忆化之间的关系。

大型语言模型在少样本上下文学习方面表现出色，通过从上下文中提供的少量示例进行学习。多样本学习方法在各种任务中取得显著性能提升，但受限于可用的人类生成示例。增强和无监督的多样本学习方法在复杂推理任务中非常有效。多样本学习可以覆盖预训练偏差，并学习具有数值输入的高维函数。下一个标记预测损失作为下游上下文学习性能指标存在局限性。