结合试验与观察数据的外部有效政策评估

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

该研究提出了一种新型的政策学习框架,解决了实际场景中正性假设不可行的挑战。通过半参数效率理论建立了增量倾向得分策略的特征和识别条件,并提出了高效估计器,验证了该框架在有限样本情况下的性能。

🎯

关键要点

  • 该研究提出了一种新型的无正性假设的政策学习框架。
  • 框架旨在解决实际场景中正性假设不可行的挑战。
  • 利用增量倾向得分策略调整倾向得分值,而非固定值分配。
  • 通过半参数效率理论建立增量倾向得分策略的特征和识别条件。
  • 提出了高效估计器,能够实现快速收敛速度。
  • 框架在有限样本情况下的性能通过全面的数值实验得到了验证。
  • 确保从观察数据中识别因果效应的可靠性和稳健性。
➡️

继续阅读