带理查森-罗伯格外推的随机梯度下降的非渐近分析
💡
原文中文,约2300字,阅读约需6分钟。
📝
内容提要
研究解决了随机梯度下降在强凸光滑最小化问题中的偏差问题。新方法改进了均方误差的分解,明确了最优协方差矩阵的依赖性。发现均方误差的主要项为$ ^{-1/2}$,次主项为$ ^{-3/4}$,表明更精确的分析可推动SGD的应用。
🎯
关键要点
- 本研究解决了随机梯度下降(SGD)算法在强凸光滑最小化问题中的偏差问题。
- 提出了一种新的扩展方法,显著改进了均方误差的分解形式。
- 明确了最优协方差矩阵的依赖性。
- 均方误差的主要项为O(n^{-1/2}),次主项为O(n^{-3/4})。
- 该结果在一般情况下无法改进,预示着更精确的分析可能推动SGD的应用。
➡️