带理查森-罗伯格外推的随机梯度下降的非渐近分析

💡 原文中文,约2300字,阅读约需6分钟。
📝

内容提要

研究解决了随机梯度下降在强凸光滑最小化问题中的偏差问题。新方法改进了均方误差的分解,明确了最优协方差矩阵的依赖性。发现均方误差的主要项为$ ^{-1/2}$,次主项为$ ^{-3/4}$,表明更精确的分析可推动SGD的应用。

🎯

关键要点

  • 本研究解决了随机梯度下降(SGD)算法在强凸光滑最小化问题中的偏差问题。
  • 提出了一种新的扩展方法,显著改进了均方误差的分解形式。
  • 明确了最优协方差矩阵的依赖性。
  • 均方误差的主要项为O(n^{-1/2}),次主项为O(n^{-3/4})。
  • 该结果在一般情况下无法改进,预示着更精确的分析可能推动SGD的应用。
➡️

继续阅读