预测优化框架的最佳策略学习
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
我们提出了一种新颖的决策感知替代损失函数家族,称为扰动梯度(PG)损失函数,用于预测 - 优化框架。与现有的替代损失函数不同,我们的 PG 损失函数的近似误差随着样本数量的增加而消失。我们提供了数值证据,证实当基础模型发生错配且噪声不是中心对称时,我们的 PG 损失函数在实质上优于现有的提案。PG 损失函数提供了一种新颖的、在理论上有理据的、可计算的、决策感知学习的方法。
🎯
关键要点
- 提出了一种新颖的决策感知替代损失函数,称为扰动梯度(PG)损失函数。
- PG损失函数用于预测-优化框架,直接近似下游决策损失。
- PG损失函数的近似误差随着样本数量的增加而消失。
- 在错配设置中,PG损失函数渐近地产生最佳策略,优于现有提案。
- 提供了数值证据,证明PG损失函数在基础模型错配且噪声非中心对称时的优越性。
- PG损失函数为实践中常见的错配情况提供了一种新颖、理论有理据、可计算的决策感知学习方法。
🏷️
标签
➡️