结合试验与观察数据的外部有效政策评估
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
该研究提出了一种新型的政策学习框架,解决了实际场景中正性假设不可行的挑战。通过半参数效率理论建立了增量倾向得分策略的特征和识别条件,并提出了高效估计器,验证了该框架在有限样本情况下的性能。
🎯
关键要点
- 该研究提出了一种新型的无正性假设的政策学习框架。
- 框架旨在解决实际场景中正性假设不可行的挑战。
- 利用增量倾向得分策略调整倾向得分值,而非固定值分配。
- 通过半参数效率理论建立增量倾向得分策略的特征和识别条件。
- 提出了高效估计器,能够实现快速收敛速度。
- 框架在有限样本情况下的性能通过全面的数值实验得到了验证。
- 确保从观察数据中识别因果效应的可靠性和稳健性。
➡️