本论文介绍了一种因果深度集框架,消除了关键结构假设,引入了置换不变性假设,提供了更灵活的估计方法。数值分析表明,该方法较现有算法更精确,提高了离线策略评估方法的实际适用性和效率。
完成下面两步后,将自动完成登录并继续当前操作。