小红花·文摘

本研究探讨了Polyak-Lojasiewicz不等式的广义及其对优化问题中梯度流行为的影响，指出了文献中较弱PLI版本的不足。研究表明，成本函数的不等式类型显著影响梯度流解的特征，为CT-LQR政策优化提供了新的理论框架。

关于Polyak-Lojasiewicz不等式及其对梯度系统收敛性的影响的探讨

BriefGPT - AI 论文速递 ·

本文研究了经过梯度流训练的单隐藏层ReLU网络在$n$个数据点上的收敛性，发现宽度为$ ext{log}(n)$的网络能够高概率实现全局收敛，并揭示了收敛速度的渐近特征。

弱交互数据上浅层ReLU网络的收敛性

BriefGPT - AI 论文速递 ·

本研究分析自注意力模型中的动态亚稳态现象，发现粒子最终会聚集成一个簇，但可能在多个簇的状态下长时间停留。通过梯度流和慢运动框架，揭示在适当时间缩放下，能量在有限时间内达到全局最大值，并呈现阶梯状特征。

Dynamic Metastability in Self-Attention Models

BriefGPT - AI 论文速递 ·

本文研究了基于梯度流的采样方法的设计要素，包括能量函数、度量和梯度流的数值近似。通过展示Kullback-Leibler散度的独特性质，研究了度量的选择，并构建了各种仿射不变的梯度流。提出了基于高斯近似的梯度流方法，并研究了其收敛性。

再生核希尔伯特空间中 f - 散度的 Moreau 衬度的 Wasserstein 梯度流

BriefGPT - AI 论文速递 ·

该研究提出了一种基于梯度流的无参数算法，用于学习复杂数据集的潜在分布和从中进行抽样。该算法建立在隐式生成建模与最优输运之间的联系理论基础上，并通过泛函优化问题的方式得以实现。实验结果表明，该算法能够成功地捕捉不同类型的数据分布结构。

离散概率流通过最优传输的构建

BriefGPT - AI 论文速递 ·

该文研究了针对凸目标函数的梯度流、加速梯度下降和随机梯度下降优化方法。研究发现，梯度流在希尔伯特空间中最优，但收敛缓慢；在有限维空间中，存在凸函数的梯度流曲线，其减小速度比任何单调递减且在无穷远处可积的给定函数更慢。类似的结果也适用于离散时间梯度下降、具有乘积噪声的随机梯度下降和重球 ODE 问题。

有限维与无限维希尔伯特空间中凸函数的梯度流的定性差异

BriefGPT - AI 论文速递 ·

该研究提出了一种基于梯度流的无参数算法，用于学习复杂数据集的潜在分布和从中进行抽样。实验结果表明，该算法能够成功地捕捉不同类型的数据分布结构。

通过 Wasserstein 空间中的近端梯度下降实现基于流的生成模型的收敛

BriefGPT - AI 论文速递 ·

本文研究了基于梯度流的采样方法的设计要素，包括能量函数、度量和梯度流的数值近似。研究表明，Kullback-Leibler散度作为能量函数具有独特性质，度量的选择从不变性的角度出发，构建了各种仿射不变的Wasserstein和Stein梯度流。提出了基于高斯近似的梯度流方法，并与参数变分推断衍生的梯度方法建立了联系，研究了它们的收敛性。

概率测度空间中的梯度流采样

BriefGPT - AI 论文速递 ·