本研究提出了一种通用的策略梯度方法DRPMD,旨在解决强健马尔可夫决策过程中的模型不确定性问题,确保全局最优性,并在复杂场景中验证其强健性和全局收敛性。
本文研究了ReLU神经网络的逼近能力,发现深层网络在逼近光滑函数方面优于浅层网络。通过分析超参数和随机初始化,证明了深层网络在优化中具有更强的全局收敛性。此外,过度参数化对优化景观有重要影响,浅层ReLU网络在高维空间中也能有效逼近Hölder函数。
本研究提出了一种新拟牛顿方法,用于解决平滑和单调非线性方程,特别是无约束最小化和最小最大优化问题。通过在线学习更新雅可比矩阵,该方法在强单调性下比传统外梯度方法具有更好的全局收敛性和更快的收敛速度。
本文探讨了高维混合模型的参数估计及EM算法的改进,提出了一种基于矩估计法的无监督学习方法,改进了初始化技术以避免局部最优解问题,并提出了量子算法版本的EM算法,提升了收敛速度和精度。同时,研究了高斯混合模型的全局收敛性及其在过参数化设置中的表现。
本文探讨了期望最大化(EM)算法在高维潜变量模型中的应用,提出了一种结合稀疏结构的新型高维EM算法。研究了高斯混合模型的梯度EM算法,证明其全局收敛性,并分析了学习过参数化GMM的挑战。此外,提出了基于边界优化的参数学习方法,强调数据预处理对算法性能的影响。
本文提出了多种优化算法,解决非凸和非光滑的机器学习问题,包括近似正则化路径追踪、BFGS方法的扩展和随机拟牛顿方法。这些算法展示了全局收敛性和高效性,能够有效利用曲率信息,优化样本复杂度,适用于深度学习等领域。
完成下面两步后,将自动完成登录并继续当前操作。