本文探讨了大型图形的两样本检验问题,比较了现有的理论检验方法及其自举变体,并提出了一种新的渐近分布检验方法,具有更低的计算复杂度和更高的可靠性。此外,研究了网络统计学在假设检验中的应用,提出了针对大类非参数测试的框架,强调了其在在线数据流监控和类型 I 错误控制方面的优势。
该文介绍了一种在线鲁棒的策略评估过程,基于巴哈多表示建立了估计器的极限分布,并开发了一种完全在线的过程,以基于渐近分布进行高效的统计推断。该方法将鲁棒统计与强化学习中的统计推断联系起来,为策略评估提供了更可靠的方法。数值实验验证了该算法的有效性。
完成下面两步后,将自动完成登录并继续当前操作。