化合收益降低强化学习的方差

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

本文提出了一种具有优越性能的Riemannian随机拟牛顿算法,能够在不确定性的情况下实现多个梯度的加、减、平均,并对非凸和收缩凸函数进行了收敛性分析。实验结果表明该算法在计算Karcher平均值和低秩矩阵时优于当前最先进的批量和随机梯度算法。

🎯

关键要点

  • 提出了一种具有优越性能的Riemannian随机拟牛顿算法。
  • 该算法能够在不确定性情况下实现多个梯度的加、减、平均。
  • 对非凸和收缩凸函数进行了收敛性分析。
  • 在Karcher平均值计算和低秩矩阵方面进行了评估与实验。
  • 实验结果表明该算法优于当前最先进的批量和随机梯度算法。
➡️

继续阅读