本研究分析了变压器模型在时间序列预测中的低效,发现其泛化能力不及线性残差模型。提出了“非对称学习”理论,阐明了注意力网络的机制及其在处理不一致数据时的局限性,为改进变压器架构提供了理论依据。
完成下面两步后,将自动完成登录并继续当前操作。