关于Kolmogorov-Arnold网络的训练
发表于: 。本研究解决了Kolmogorov-Arnold网络(KAN)与多层感知器(MLP)架构在训练动态上的差异问题。通过比较不同的初始化方案、优化器和学习率,我们发现KAN在高维数据集上的测试准确性被证明是MLP的有效替代方案,尽管其训练动态不够稳定。最后,文章提出了改善大规模KAN模型训练稳定性的建议。
本研究解决了Kolmogorov-Arnold网络(KAN)与多层感知器(MLP)架构在训练动态上的差异问题。通过比较不同的初始化方案、优化器和学习率,我们发现KAN在高维数据集上的测试准确性被证明是MLP的有效替代方案,尽管其训练动态不够稳定。最后,文章提出了改善大规模KAN模型训练稳定性的建议。