模型导向的强化学习在 DAG 空间的树搜索中的应用于因果关系发现
原文中文,约300字,阅读约需1分钟。发表于: 。通过树搜索的模型驱动增量式有向无环图建立,提出了一种基于因果关系的强化学习方法,并通过一个有效算法证明了排除引入循环边缘的正确性,实现了在有向无环图空间中更深层的离散搜索和抽样,为组合方法提供了有希望的进展。
本研究提出了一种针对因果有向无环图的干预设计的通用下限,并通过有向团树将DAG分解成可独立定向的组件。研究证明,在任何EC中定向任何DAG所需的单节点干预数至少是每个基本图的链组件中最大团大小的一半的总和。同时,研究还提出了一个两阶段干预设计算法,其性能符合以最大团个数的对数乘性为界限的最优干预数,并通过实验验证了算法的有效性。