在神经网络中倾斜彩票的机会:过参数化和课程表的相互作用

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

研究发现,使用二次激活函数可以在过参数化情况下训练浅层神经网络并找到全局最优解。此方法适用于任何训练数据,并可使用本地搜索启发式方法高效地找到全局最优解。同时,对于差分激活函数,梯度下降法可以以线性速度收敛到全局最优解。

🎯

关键要点

  • 研究发现,使用二次激活函数可以在过参数化情况下训练浅层神经网络并找到全局最优解。
  • 此方法适用于具有任意输入/输出对的任何训练数据。
  • 可以使用各种本地搜索启发式方法高效地找到全局最优解。
  • 对于差分激活函数,梯度下降法在合适的初值下可以以线性速度收敛到全局最优解。
  • 输入来自符合高斯分布的选定属性,标记通过种植的重量系数生成。
🏷️

标签

➡️

继续阅读