化合收益降低强化学习的方差
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
本文提出了一种具有优越性能的Riemannian随机拟牛顿算法,能够在不确定性的情况下实现多个梯度的加、减、平均,并对非凸和收缩凸函数进行了收敛性分析。实验结果表明该算法在计算Karcher平均值和低秩矩阵时优于当前最先进的批量和随机梯度算法。
🎯
关键要点
- 提出了一种具有优越性能的Riemannian随机拟牛顿算法。
- 该算法能够在不确定性情况下实现多个梯度的加、减、平均。
- 对非凸和收缩凸函数进行了收敛性分析。
- 在Karcher平均值计算和低秩矩阵方面进行了评估与实验。
- 实验结果表明该算法优于当前最先进的批量和随机梯度算法。
🏷️
标签
➡️