小红花·文摘

研究探讨了前馈神经网络的复杂性，指出不同参数化可以实现相同功能，并通过排列不变性推导出新的覆盖数界限。适当的随机初始化策略能提高优化收敛概率，过度参数化的网络更易训练，而增加宽度可能导致有效参数空间的消失。这些发现对深度学习的泛化和优化具有重要意义。