小红花·文摘

本研究探讨了过参数化神经网络的泛化能力，证明测试误差与过参数化水平及VP维度无关。提出了一种新方法，通过构建零损失最小化器，发现泛化误差与数据几何、激活函数的光滑性及权重范数相关。

BriefGPT - AI 论文速递 ·

本文提出了过度参数化模型的理论，该模型能够插值训练数据。最佳模型是过度参数化的，与模型阶数呈双峰形。文章分析了最小二乘问题的解的内插模型和使用岭回归进行模型拟合的情况，并提出了一个基于回归矩阵最小奇异值行为的结果，可以解释测试误差随模型阶数的峰值位置和双峰形状。

BriefGPT - AI 论文速递 ·