Risk-Sensitive Reinforcement Learning Based on Convex Scoring Functions

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本文提出了一种针对风险目标的强化学习方法,采用广泛的凸评分函数,涵盖多种风险衡量标准。通过引入辅助变量和扩展状态空间,开发了定制的演员-评论家算法,实验证明其在统计套利交易中的有效性。

🎯

关键要点

  • 提出了一种针对风险目标的强化学习方法。
  • 采用广泛的凸评分函数,涵盖多种风险衡量标准。
  • 引入辅助变量和扩展状态空间。
  • 开发了定制的演员-评论家算法。
  • 该算法在统计套利交易中表现出有效性。
➡️

继续阅读