本文研究了大型语言模型的上下文学习能力,通过马尔可夫链序列建模任务揭示了变压器层之间的交互作用对成功学习的影响,并探讨了马尔可夫链的先验分布和上下文学习的拓展。
完成下面两步后,将自动完成登录并继续当前操作。