因果深集在空间或时空干扰下的离线策略评估
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
本论文介绍了一种因果深度集框架,消除了关键结构假设,引入了置换不变性假设,提供了更灵活的估计方法。数值分析表明,该方法较现有算法更精确,提高了离线策略评估方法的实际适用性和效率。
🎯
关键要点
- 本论文介绍了一种因果深度集框架,消除了关键结构假设。
- 引入了置换不变性假设,提供了更灵活的估计方法。
- 该方法通过数据驱动的自适应学习均场函数,超越传统平均化。
- 提出了将置换不变性假设融入离线策略评估的新算法。
- 数值分析表明,该方法较现有算法更精确。
- 提高了离线策略评估方法的实际适用性和效率。
- 提出的方法已提供 Python 实现。
➡️