广义浓缩条件下的马尔可夫链赫夫丁不等式
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
本文研究了马尔可夫链的Hoeffding不等式,使用积分概率度量(IPM)定义的广义可集中条件建立了一个框架,扩展了现有假设,使得Hoeffding不等式能够应用于传统意义上的非递凡马尔可夫链之外的情况。作者应用该框架到机器学习领域的几个非渐近分析,证明了其实用性。
🎯
关键要点
- 本文研究马尔可夫链的Hoeffding不等式。
- 使用积分概率度量(IPM)定义的广义可集中条件建立框架。
- 扩展现有假设,使Hoeffding不等式适用于非递凡马尔可夫链。
- 框架的灵活性使得Hoeffding不等式的应用范围更广。
- 将框架应用于机器学习领域的非渐近分析。
- 包括基于马尔可夫样本的经验风险最小化的一般性界限。
- SGD的Ployak-Ruppert平均的有限样本保证。
- 具有一般状态空间的休息马尔可夫强盗的新后悔界限。
➡️