小红花·文摘 - 小红花技术领袖俱乐部

该研究探讨了使用随机梯度下降来最小化Lipschitz函数和强凸函数但不一定可微的问题。通过证明，在T步随机梯度下降后，最终迭代的误差高概率为O(log(T)/T)。同时，构造了一个函数，证明了在确定性梯度下降中，最终迭代的误差为Ω(log(T)/T)。在采用后缀平均法的情况下，证明了其高概率误差界是优化函数相关类别中的最优界（O(1/T)）。最后，证明了对于Lipschitz和凸函数类，使用随机梯度下降解决此问题后，最终迭代的误差高概率为O(log(T)/sqrt(T))。

梯度下降的非均匀平滑性

BriefGPT - AI 论文速递 ·

该文介绍了使用随机梯度下降算法解决Lipschitz和强凸函数问题，证明了最终迭代的误差高概率为O(log(T)/T)。同时，探讨了确定性梯度下降和后缀平均法的误差界，并证明了使用随机梯度下降解决Lipschitz和凸函数问题后，最终迭代的误差高概率为O(log(T)/sqrt(T))。

基于随机对偶平均的快速期望对数损失最小化

BriefGPT - AI 论文速递 ·

该文介绍了一种稀疏的现代 Hopfield 模型，实现了稀疏注意机制和记忆检索动态，并提供了稀疏度相关的记忆检索误差界。实验结果表明，稀疏 Hopfield 模型在许多情况下优于其密集对应物。

稀疏现代 Hopfield 模型

BriefGPT - AI 论文速递 ·

该文介绍了一种新的无监督域自适应方法，通过优化误差界的三个项，迭代搜索共享特征子空间，降低数据分布差异并增加类间距离，有效学习目标数据的预测器。同时，考虑了数据异常值的影响以避免负面知识迁移。实验验证了该方法的有效性和优越性。

让 UDA 中的 U 有意义：无监督领域自适应的不变一致性学习

BriefGPT - AI 论文速递 ·