基于 Sarsa 和 Q 学习的异构智能目标跟踪的索引策略

💡 原文中文,约500字,阅读约需2分钟。
📝

内容提要

该研究探讨了利用强化学习在S&P 500指数上进行交易的可行性。实验结果显示,训练数据集中包含COVID-19时期的市场数据可以比基准策略获得更好的性能。在线策略方法(VI和SARSA)胜过Q-Learning,并突显了偏差-方差权衡和简单政策的泛化能力。未来工作包括尝试更新的Q-Learning策略和探索替代经济指标用于训练模型。

🎯

关键要点

  • 该研究探讨了利用强化学习在S&P 500指数上进行交易的可行性。
  • 采用了Value Iteration (VI)、SARSA的在线策略和Q-Learning的离线策略进行实验。
  • 使用2000年至2023年的股市数据集进行训练和测试,包括COVID-19时期的数据。
  • 实验结果显示,包含COVID-19时期市场数据的训练集比基准策略表现更好。
  • 在线策略方法(VI和SARSA)胜过Q-Learning,突显了偏差-方差权衡和简单政策的泛化能力。
  • Q-Learning的性能可能会因未来市场情况的稳定性而有所不同。
  • 未来工作包括尝试更新的Q-Learning策略和探索替代经济指标用于训练模型。
➡️

继续阅读