研究分析了随机梯度下降(SGD)及其变种在非光滑激活函数神经网络中的收敛性,提出了一个新的框架,通过更新动量项和不同时间尺度的变量分配。在温和条件下,证明了该框架的全局收敛性,并能找到目标函数的Clarke稳定点。数值实验表明这些方法效率高。
我们研究了在源域训练并在目标域部署的离线动态强化学习。通过在线分布鲁棒的马尔可夫决策过程,设计了一个基于总变差距离的不确定性集合,解决非线性问题。提出的DR-LSVI-UCB算法在离线动态强化学习中高效逼近,并与状态和动作空间大小无关,具有多项式次优性界限。数值实验验证了算法的性能和鲁棒性。
通过解决对数密度福克-普朗克方程的数值求解,提高基于分数的扩散模型的训练效率,并通过预先计算的分数嵌入到图像中来加快训练速度和减少图像数,学习准确分数。数值实验展示了该方法相对于标准基于分数的扩散模型的改进性能。
本文提出了一种基于张量网络的量子计算方法,用于解决量子计算中的机器学习挑战,并通过数值实验验证了其可行性。
该文章介绍了一种新的方法,利用深度神经网络导出和分析随机微分方程。该方法通过学习维纳混沌展开式的最佳稀疏截断来减轻指数复杂性问题,利用随机过程的多项式混沌展开。数值实验展示了该方法在一维和高维中的有希望性能。
本文提出了个性化图形联邦学习(PGFL)框架,通过分布式连接的服务器和边缘设备协作学习设备或集群特定的模型,同时维护每个个体设备的隐私。利用差分隐私的变量PGFL实现,可以在线性时间内收敛于每个集群的最优集群特定解。通过使用合成数据和MNIST数据集进行回归和分类的数值实验,检验了所提出的PGFL算法的性能。
该研究使用随机TR和ARC方法实现近似二阶最优性,减少每次迭代的传播开销。数值实验表明,该算法每次迭代所需的计算开销较当前的二阶方法更少。
该文介绍了一种解决无休止多臂赌博问题的观测模型,应用可实现区域方法和部分守恒定律分析其可索引性和优先指数。提出了一个近似过程来将问题转化为有限状态问题,并进行了数值实验。
本文提出了一种通过学习具有预设上界的非凸正则化器的方法,该方法能够产生能够最小化凸能量的变分去噪器。数值实验证明了该去噪器在性能上优于凸正则化方法和BM3D去噪器。学习到的正则化器还可用于求解具有可证收敛性的迭代方案的逆问题。该正则化器在CT和MRI重建中具有很好的泛化性能,并在性能、参数数量、保证性和可解释性等方面与其他数据驱动方法相比具有出色的平衡。
完成下面两步后,将自动完成登录并继续当前操作。