小红花·文摘

本研究提出了一种名为RLBayes的算法，旨在解决贝叶斯网络结构学习中的搜索空间问题。该算法基于强化学习，通过动态维护Q表来指导学习，理论和实验结果表明其在全局最优结构收敛性和效果上优于其他启发式搜索算法。