该论文探讨了Thompson采样在贝叶斯策略中的应用,提出了因果贝叶斯优化(CBO)和图无关因果贝叶斯优化(GACBO)算法,旨在优化决策过程并解决复杂性问题,展示了在多个实际应用中的优越性。
本研究提出了图无关因果贝叶斯优化(GACBO)算法,旨在优化未知因果图上的目标变量。该算法能够主动发现对最佳奖励有贡献的因果结构,并在模拟和实际应用中表现优于基线方法。
本文介绍了一种受约束的因果贝叶斯优化方法(cCBO),可在已知因果图中找到优化目标变量并满足约束条件的干预措施。通过代理模型和观察干预数据,捕捉不同层次的效果相关性。该方法在人工和真实世界的因果图中具有快速收敛和可行性干预比例间的成功权衡。
完成下面两步后,将自动完成登录并继续当前操作。