用于稀疏线性系统迭代解的图神经预处理器
该文章介绍了一种新的方法,通过利用曲率信息加速随机梯度下降(SGD)。该方法使用两个预条件器,并使用稳健的在线更新来保持对称性和不变性。该方法在多个深度学习任务上优于现有方法。
原文中文,约400字,阅读约需1分钟。
该文章介绍了一种新的方法,通过利用曲率信息加速随机梯度下降(SGD)。该方法使用两个预条件器,并使用稳健的在线更新来保持对称性和不变性。该方法在多个深度学习任务上优于现有方法。