趋向无深度限制的训练:无梯度爆炸的批归一化
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文介绍了一种带有线性激活函数和批归一化的多层感知机模型,证明了其正向信号传播特性的精确表征。同时,提出了一种激活函数塑形方案,能够在某些非线性激活函数下实现类似的特性。在线性独立的输入样本情况下,该模型能够渐近地保持梯度有界的特性。
🎯
关键要点
-
本文介绍了一种带有线性激活函数和批归一化的多层感知机模型。
-
通过Weingarten微积分方法证明了该模型正向信号传播特性的精确表征。
-
模型在输入样本线性独立的情况下,能够渐近地保持梯度有界的特性。
-
提出了一种激活函数塑形方案,能够在某些非线性激活函数下实现类似特性。
➡️