趋向无深度限制的训练:无梯度爆炸的批归一化

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文介绍了一种带有线性激活函数和批归一化的多层感知机模型,证明了其正向信号传播特性的精确表征。同时,提出了一种激活函数塑形方案,能够在某些非线性激活函数下实现类似的特性。在线性独立的输入样本情况下,该模型能够渐近地保持梯度有界的特性。

🎯

关键要点

  • 本文介绍了一种带有线性激活函数和批归一化的多层感知机模型。

  • 通过Weingarten微积分方法证明了该模型正向信号传播特性的精确表征。

  • 模型在输入样本线性独立的情况下,能够渐近地保持梯度有界的特性。

  • 提出了一种激活函数塑形方案,能够在某些非线性激活函数下实现类似特性。

➡️

继续阅读