BriefGPT - AI 论文速递 ·

基于随机线搜索的过参数化模型优化的收敛条件

💡 原文中文，约1300字，阅读约需4分钟。

📝

内容提要

本文提出了一种结合确定性方法与贝叶斯优化的概率线性搜索算法，利用高斯过程代理优化目标，消除了随机梯度下降学习率的定义。研究了多种算法的收敛性与复杂度，展示了在非凸问题中实现线性收敛率的有效性，并提出了新算法 AdaSPS 和 AdaSLS，以改进超参数化模型的训练效果。

🎯

❓

概率线性搜索算法结合了确定性方法与贝叶斯优化，使用高斯过程代理优化目标，消除了对随机梯度下降学习率的定义。

AdaSPS 和 AdaSLS 是新提出的算法，保证在非插值设置下的收敛，并改进了超参数化模型的训练效果。

通过使用线性搜索技术自动设置步长的随机梯度下降算法，可以实现凸和强凸函数的确定性收敛率。

研究展示了基于随机一阶模型的线搜索方法的全局收敛速度，并评估了其复杂度与确定性模型相同。

方差缩减技术改进了非插值区域的收敛速度，达到了 O（ε）次优性，提升了算法的效率。

在大型过度参数化模型中，常数步长下的随机梯度下降可以实现指数收敛，尤其在损失函数为凸函数时。

🏷️