AdaResNet:通过动态权重调整增强残差网络以改善特征整合

💡 原文中文,约600字,阅读约需2分钟。
📝

内容提要

本文通过使用剩余雅可比矩阵对ResNet架构进行实证研究,揭示了Residual Alignment (RA)的四个特征。RA在泛化良好的模型中始终存在,但一旦跳跃连接被移除,RA将不再出现。该现象揭示了ResNet的残差分支之间的强大对齐性(RA2+4),将中间表示沿着网络线性推进(RA1)直到最后一层,在最后一层中,它们经历了神经崩溃(Neural Collapse)。

🎯

关键要点

  • ResNet架构通过跳跃连接显著提高性能,但其成功机制仍不完全清楚。
  • 使用剩余雅可比矩阵对ResNet残差块进行线性化和奇异值分解,揭示了Residual Alignment (RA)过程。
  • RA具有四个特征:中间表示在高维空间中等间隔嵌入(RA1),残差雅可比的奇异向量对齐(RA2),残差雅可比的可逆性(RA3),前奇异值与深度成反比(RA4)。
  • RA在泛化良好的模型中始终存在,但一旦移除跳跃连接,RA将不再出现。
  • 提出的新数学模型验证了RA现象,揭示了ResNet残差分支之间的强大对齐性(RA2+4)和中间表示的线性推进(RA1),最终经历神经崩溃(Neural Collapse)。
➡️

继续阅读