小红花·文摘

本文研究了预训练的注意力模型在具有高斯先验的线性回归的上下文学习中的能力。研究表明，有效的预训练只需要少量独立任务，预训练模型与贝叶斯最优算法高度匹配，在未见任务上实现几乎贝叶斯最优风险。这些理论发现补充了先前的实验研究，并阐明了ICL的统计基础。