预测优化框架的最佳策略学习

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

我们提出了一种新颖的决策感知替代损失函数家族,称为扰动梯度(PG)损失函数,用于预测 - 优化框架。与现有的替代损失函数不同,我们的 PG 损失函数的近似误差随着样本数量的增加而消失。我们提供了数值证据,证实当基础模型发生错配且噪声不是中心对称时,我们的 PG 损失函数在实质上优于现有的提案。PG 损失函数提供了一种新颖的、在理论上有理据的、可计算的、决策感知学习的方法。

🎯

关键要点

  • 提出了一种新颖的决策感知替代损失函数,称为扰动梯度(PG)损失函数。
  • PG损失函数用于预测-优化框架,直接近似下游决策损失。
  • PG损失函数的近似误差随着样本数量的增加而消失。
  • 在错配设置中,PG损失函数渐近地产生最佳策略,优于现有提案。
  • 提供了数值证据,证明PG损失函数在基础模型错配且噪声非中心对称时的优越性。
  • PG损失函数为实践中常见的错配情况提供了一种新颖、理论有理据、可计算的决策感知学习方法。
➡️

继续阅读