广义随机Halpern算法的渐近正则性及其应用
发表于: 。该研究解决了广义随机Halpern迭代在优化时的渐近正则性问题,提出了一种抽象的随机迭代方法。研究特别指出对于特定情况,得到了与随机优化领域已有最佳已知速率相匹配或提升的线性渐近正则速率,并在内积空间中获得了二次渐近正则速率。这些发现为在强化学习中的Q学习方法提供了创新思路。
该研究解决了广义随机Halpern迭代在优化时的渐近正则性问题,提出了一种抽象的随机迭代方法。研究特别指出对于特定情况,得到了与随机优化领域已有最佳已知速率相匹配或提升的线性渐近正则速率,并在内积空间中获得了二次渐近正则速率。这些发现为在强化学习中的Q学习方法提供了创新思路。