小红花·文摘

本研究探讨了单层变换器在无噪声和有噪声上下文推理中的近似能力与收敛行为，提出了一种贝叶斯最优的单层变换器，证明其在有限样本下以线性速率收敛到贝叶斯风险，并具备良好的泛化能力。