小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出了一种通用的策略梯度方法DRPMD,旨在解决强健马尔可夫决策过程中的模型不确定性问题,确保全局最优性,并在复杂场景中验证其强健性和全局收敛性。

Policy Gradient for Robust Markov Decision Processes

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-29T00:00:00Z

本文研究了ReLU神经网络的逼近能力,发现深层网络在逼近光滑函数方面优于浅层网络。通过分析超参数和随机初始化,证明了深层网络在优化中具有更强的全局收敛性。此外,过度参数化对优化景观有重要影响,浅层ReLU网络在高维空间中也能有效逼近Hölder函数。

随机浅层ReLU网络的函数梯度近似与控制应用

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-07T00:00:00Z

本研究提出了一种新拟牛顿方法,用于解决平滑和单调非线性方程,特别是无约束最小化和最小最大优化问题。通过在线学习更新雅可比矩阵,该方法在强单调性下比传统外梯度方法具有更好的全局收敛性和更快的收敛速度。

Quasi-Newton Method Guided by Online Learning and Its Global Non-Asymptotic Convergence

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-03T00:00:00Z

本文探讨了高维混合模型的参数估计及EM算法的改进,提出了一种基于矩估计法的无监督学习方法,改进了初始化技术以避免局部最优解问题,并提出了量子算法版本的EM算法,提升了收敛速度和精度。同时,研究了高斯混合模型的全局收敛性及其在过参数化设置中的表现。

利用热启动EM学习大型软最大混合模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-16T00:00:00Z

本文探讨了期望最大化(EM)算法在高维潜变量模型中的应用,提出了一种结合稀疏结构的新型高维EM算法。研究了高斯混合模型的梯度EM算法,证明其全局收敛性,并分析了学习过参数化GMM的挑战。此外,提出了基于边界优化的参数学习方法,强调数据预处理对算法性能的影响。

基于对数索勒维不等式的期望最大化算法快速收敛

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-25T00:00:00Z

本文提出了多种优化算法,解决非凸和非光滑的机器学习问题,包括近似正则化路径追踪、BFGS方法的扩展和随机拟牛顿方法。这些算法展示了全局收敛性和高效性,能够有效利用曲率信息,优化样本复杂度,适用于深度学习等领域。

一种适应性二阶方法用于非凸非光滑复合优化问题

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-24T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码