小红花·文摘

本文研究了大型语言模型（LLMs）在上下文学习（ICL）中的表现，指出其在理解上下文和长文本方面的局限性。通过微调，模型在复杂任务上的表现有所改善，表明问题源于对齐方法的不足。此外，ICL被视为隐含的指令调优，并与贝叶斯推断相关。研究还提出了模型缩放规律的最佳实践，为模型选择提供参考。