用广义的布雷格曼散度驯服非凸随机镜像下降

BriefGPT - AI 论文速递 BriefGPT - AI 论文速递 ·

该论文重新审视了非凸优化设置中随机镜像下降(SMD)的收敛性,并克服了先前结果的限制。通过新的非凸SMD收敛分析,将结果扩展到高概率收敛和全局收敛。研究表明,改进的SMD理论在非凸机器学习任务中具有优势。同时,开发了可证明收敛的随机算法用于训练线性神经网络。

原文中文,约500字,阅读约需2分钟。
阅读原文