因果深集在空间或时空干扰下的离线策略评估
原文中文,约400字,阅读约需1分钟。发表于: 。本论文介绍了一种因果深度集框架,该框架在处理时空干预的现有离线策略评估方法中,消除了一些关键结构假设,主要是平均场假设。引入了置换不变性假设,该创新方法通过数据驱动的自适应学习均场函数,提供了一种超越传统平均化的更灵活的估计方法。此外,我们提出了将置换不变性假设融入离线策略评估的新算法,并对其理论基础进行了全面的研究。我们的数值分析表明,这种新方法较现有基准算法能够产生显著更精确的估计结果,...
本论文介绍了一种因果深度集框架,消除了关键结构假设,引入了置换不变性假设,提供了更灵活的估计方法。数值分析表明,该方法较现有算法更精确,提高了离线策略评估方法的实际适用性和效率。