马尔可夫链中心极限定理的收敛速度及其在 TD 学习中的应用
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
该研究提出了一种在高维环境下获得中心极限定理(CLT)收敛速率的新方法,并应用该方法得到了交通距离和熵的新界限。通过推导对于有界随机向量的二次Wasserstein运输距离收敛的最佳界限,以及一般对数凹随机向量的信息熵CLT的非渐近收敛速度,给出了在对数凹性假设下的交通距离收敛的改进界限。该方法基于鞅嵌入,具体地,基于Skorokhod嵌入。
🎯
关键要点
- 该研究提出了一种在高维环境下获得中心极限定理(CLT)收敛速率的新方法。
- 运用该方法获得了交通距离和熵的新界限。
- 改进了有界随机向量的二次Wasserstein运输距离收敛的已知最佳界限。
- 推导了对数凹随机向量的信息熵CLT的第一个非渐近收敛速度。
- 在对数凹性假设下给出了交通距离收敛的改进界限。
- 在强对数凹性的假设下,两个指标的改进得到了改善。
- 该方法基于鞅嵌入,具体基于Skorokhod嵌入。
🏷️
标签
➡️