小红花·文摘

本文探讨了深度学习中超参数化神经网络的泛化能力，研究了残差参数与泛化缺口的关系。通过拓扑数据分析，建立了计算深度神经网络内在维度的工具，以预测泛化错误。同时，分析了不同优化算法对泛化能力的影响，并提出了基于信息理论的泛化界限，强调了网络架构与泛化能力之间的关系。

BriefGPT - AI 论文速递 ·

RMIX是解决超参数化神经网络中重要性加权方法效果不佳的框架，能更好地应对含不同子群比例的训练和测试分布的子群转移问题。RMIX利用混合样本上的重要性加权来获取更鲁棒的模型，并利用训练轨迹的不确定性估计来灵活地表征子群分布。理论分析验证了RMIX具有更好的广义化界限。

BriefGPT - AI 论文速递 ·