结构之法算法之道 ·

一文通透想取代MLP的KAN：通俗理解Kolmogorov-Arnold定理和KAN的方方面面

💡 原文中文，约7400字，阅读约需18分钟。

📝

内容提要

本文介绍了KAN（Kolmogorov-Arnold Networks）的概念、发展和特点。KAN是一种替代MLP（多层感知器）的神经网络模型，使用B样条函数来构建网络，具有更好的逼近能力和可解释性。文章还比较了KAN与MLP的异同。

🎯

❓

KAN（Kolmogorov-Arnold Networks）是一种替代多层感知器（MLP）的神经网络模型，使用B样条函数构建，具有更好的逼近能力和可解释性。

KAN与MLP的主要区别在于激活函数的放置位置，KAN在边缘上放置可学习的激活函数，而MLP在节点上放置固定激活函数。

KAN的逼近能力与网格大小和样条阶数有关，增加网格点数量可以提高模型的预测准确性。

KAN通过B样条函数参数化单变量函数，并通过组合这些函数构建整个网络，允许扩展为任意宽度和深度。

KAN的设计考虑了残差激活函数和动态更新样条网格，以提高模型的性能和适应性。

Kolmogorov-Arnold表示定理表明，任意多变量连续函数可以表示为单变量函数的组合，这为KAN的构建提供了理论基础。

🏷️