平均梯度外积:作为深度神经崩溃机制

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

研究发现深度神经网络中的神经崩溃现象主要由平均梯度外积(AGOP)引起,AGOP在随机初始化的神经网络中会导致神经崩溃。

🎯

关键要点

  • 深度神经崩溃(DNC)是深度神经网络(DNNs)中最终层数据表示的刚性结构。
  • 本研究表明,DNC 主要通过平均梯度外积(AGOP)进行深度特征学习。
  • 权重的右奇异向量和奇异值是 DNNs 中类内变异性倒塌的原因之一,且与 AGOP 的奇异结构高度相关。
  • 实验和理论证明 AGOP 在随机初始化的神经网络中引起神经崩溃。
  • Deep Recursive Feature Machines 是 AGOP 在卷积神经网络中进行特征学习的抽象方法,表现出 DNC 现象。
➡️

继续阅读