小红花·文摘

本研究探讨了去噪扩散概率模型（DDPM）在高维数据中的迭代复杂度，证明其迭代复杂度与数据的内在维度近乎线性相关，显示出其在生成AI中的高效性和潜在影响。

Optimal Adaptability of Denoising Diffusion Probabilistic Models to Unknown Low Dimensionality

BriefGPT - AI 论文速递 ·

本研究分析了扩散模型的收敛性，提出了一种新的迭代复杂度 $d^{1/3} ext{ε}^{-2/3}$，优于之前的最佳复杂度。通过随机中点方法，实现了无对数凹性限制下的高效并行运算。

Improved Convergence Rate of Diffusion Probabilistic Models

BriefGPT - AI 论文速递 ·

本文介绍了加速自然策略梯度算法（ANPG）用于解决无限时间折扣奖励马尔可夫决策过程问题。ANPG在一般参数化情况下具有较低的样本复杂度和迭代复杂度，通过改进样本复杂度实现了更高的效率。该算法不需要假设重要性采样权重的方差有上界。在无Hessian和无重要性采样算法类别中，ANPG的样本复杂度超过了已知算法的倍数，并与其迭代复杂度相匹配。

受限马尔可夫决策过程中的一般参数化策略的最后迭代收敛性

BriefGPT - AI 论文速递 ·

本文研究了多智能体强化学习中策略梯度方法的全局非渐进收敛性质，提出了新的独立策略梯度算法，并证明了其达到epsilon-Nash平衡的迭代复杂度为O(1/epsilon^2)，同时建立了样本复杂度为O(1/epsilon^5)的界限。还找到了一类独立策略梯度算法，可在玩家对游戏类型无感知的情况下，实现零和马尔科夫博弈和合作马尔科夫博弈的收敛性。实验证明了理论成果的优点和有效性。

马尔可夫潜在博弈的独立策略镜像下降：扩展到大数量玩家

BriefGPT - AI 论文速递 ·

加速自然策略梯度算法（ANPG）用于解决无限时间折扣奖励马尔可夫决策过程问题。ANPG在一般参数化情况下具有较低的样本复杂度和迭代复杂度，通过改进样本复杂度提高了效率。

自然策略梯度法结合基于 Hessian 辅助的动量方差减小的全局收敛性

BriefGPT - AI 论文速递 ·

本文研究了策略梯度方法在多智能体强化学习问题上的全局非渐进收敛性质，提出了新的独立策略梯度算法，证明了算法达到epsilon-Nash平衡的迭代复杂度为O(1/epsilon^2)，建立了样本复杂度为O(1/epsilon^5)的界限。同时，找到了一类独立策略梯度算法，可在玩家对游戏类型无感知的情况下，实现零和马尔科夫博弈和合作马尔科夫博弈的收敛性。实验证明了理论成果的优点和有效性。

未知独立链 $n$- 人随机博弈中纳什均衡策略的可扩展与独立学习

BriefGPT - AI 论文速递 ·

该文提出了一种名为ANPG的学习算法，用于解决无限时间折扣奖励马尔可夫决策过程问题。该算法能够在一般参数化情况下实现O(ε^-2)的样本复杂度和O(ε^-1)的迭代复杂度，相比现有技术改进了样本复杂度。

自然策略梯度算法对无限时间折扣回报马尔可夫决策过程的参数化泛化的样本复杂度改进

BriefGPT - AI 论文速递 ·