深度学习网络的几何结构和全局 L^2 最小化器的构建

💡 原文中文,约500字,阅读约需2分钟。
📝

内容提要

该文介绍了一个浅层神经网络结构,具有隐藏层、斜坡激活函数和L2 Schatten/Hilbert-Schmidt代价函数。证明了成本函数最小值的上界,并使用投影获得了一个近似优化器。在特殊情况下,证明了成本函数的精确退化局部最小值,并展示了该网络度量了输入空间中的Q维子空间。对成本函数全局最小值的特征进行了评论。

🎯

关键要点

  • 介绍了一个浅层神经网络结构,包含一个隐藏层和斜坡激活函数。
  • 使用L2 Schatten/Hilbert-Schmidt代价函数,输入空间为R^M,输出空间为R^Q。
  • 证明了成本函数最小值的上界,依赖于训练输入的信噪比δ_P。
  • 通过投影方法获得了一个近似优化器,适用于相同输出向量的训练输入向量的平均值。
  • 在特殊情况下(M = Q),明确确定了成本函数的精确退化局部最小值。
  • 展示了该网络度量了输入空间中的Q维子空间。
  • 对成本函数全局最小值的特征进行了评论。
➡️

继续阅读