本文研究了基于梯度的算法在非凸损失景观中的应用,以及其在有限样本复杂度下的最佳泛化误差问题。以高维相位恢复问题为例,证明了随机梯度下降算法可以达到完美的泛化性能,而梯度下降算法则不能。同时,从统计物理学的角度分析了这些算法在连续时间、以热启动方式和大系统规模下的全部轨迹,并揭示了一些有趣特性。
完成下面两步后,将自动完成登录并继续当前操作。