平均梯度外积:作为深度神经崩溃机制
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
研究发现深度神经网络中的神经崩溃现象主要由平均梯度外积(AGOP)引起,AGOP在随机初始化的神经网络中会导致神经崩溃。
🎯
关键要点
- 深度神经崩溃(DNC)是深度神经网络(DNNs)中最终层数据表示的刚性结构。
- 本研究表明,DNC 主要通过平均梯度外积(AGOP)进行深度特征学习。
- 权重的右奇异向量和奇异值是 DNNs 中类内变异性倒塌的原因之一,且与 AGOP 的奇异结构高度相关。
- 实验和理论证明 AGOP 在随机初始化的神经网络中引起神经崩溃。
- Deep Recursive Feature Machines 是 AGOP 在卷积神经网络中进行特征学习的抽象方法,表现出 DNC 现象。
➡️