估计记录策略的双重稳健离线策略评估

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文研究了基于离线的评估方法,通过分层抽样生成固定大小的数据集。通过找到具有最小方差的多个记录器的估计器,解决了此困境,并提出了一个能够实现效率界限的估计器。同时,提出了一种选择控制变量的方法,以防止误工。实验证明了该方法有效利用了多个记录器的数据。

🎯

关键要点

  • 本文研究了基于离线的评估方法,采用分层抽样生成固定大小的数据集。
  • 通过找到具有最小方差的多个记录器的 OPE 估计器,解决了评估困境。
  • 建立了分层抽样下的效率界限,并提出了一个能够实现该界限的估计器。
  • 提出了一种选择控制变量的方法,以最小化方差并防止误工。
  • 实验证明该方法有效利用了多个记录器的数据。
➡️

继续阅读