多环境Q学习算法在无线网络优化中的覆盖分析
发表于: 。本文研究了多环境混合Q学习算法在无线网络优化中的数据覆盖问题。我们首次建立了不同覆盖系数的期望和方差的上界,提出了一种高效的初始化算法,并在真实无线网络中进行测试,结果显示该算法的策略错误降低了%50,运行复杂度降低了%40,具有良好的鲁棒性。
本文研究了多环境混合Q学习算法在无线网络优化中的数据覆盖问题。我们首次建立了不同覆盖系数的期望和方差的上界,提出了一种高效的初始化算法,并在真实无线网络中进行测试,结果显示该算法的策略错误降低了%50,运行复杂度降低了%40,具有良好的鲁棒性。