估计记录策略的双重稳健离线策略评估
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文研究了基于离线的评估方法,通过分层抽样生成固定大小的数据集。通过找到具有最小方差的多个记录器的估计器,解决了此困境,并提出了一个能够实现效率界限的估计器。同时,提出了一种选择控制变量的方法,以防止误工。实验证明了该方法有效利用了多个记录器的数据。
🎯
关键要点
- 本文研究了基于离线的评估方法,采用分层抽样生成固定大小的数据集。
- 通过找到具有最小方差的多个记录器的 OPE 估计器,解决了评估困境。
- 建立了分层抽样下的效率界限,并提出了一个能够实现该界限的估计器。
- 提出了一种选择控制变量的方法,以最小化方差并防止误工。
- 实验证明该方法有效利用了多个记录器的数据。
➡️