基于 Sarsa 和 Q 学习的异构智能目标跟踪的索引策略
💡
原文中文,约500字,阅读约需2分钟。
📝
内容提要
该研究探讨了利用强化学习在S&P 500指数上进行交易的可行性。实验结果显示,训练数据集中包含COVID-19时期的市场数据可以比基准策略获得更好的性能。在线策略方法(VI和SARSA)胜过Q-Learning,并突显了偏差-方差权衡和简单政策的泛化能力。未来工作包括尝试更新的Q-Learning策略和探索替代经济指标用于训练模型。
🎯
关键要点
- 该研究探讨了利用强化学习在S&P 500指数上进行交易的可行性。
- 采用了Value Iteration (VI)、SARSA的在线策略和Q-Learning的离线策略进行实验。
- 使用2000年至2023年的股市数据集进行训练和测试,包括COVID-19时期的数据。
- 实验结果显示,包含COVID-19时期市场数据的训练集比基准策略表现更好。
- 在线策略方法(VI和SARSA)胜过Q-Learning,突显了偏差-方差权衡和简单政策的泛化能力。
- Q-Learning的性能可能会因未来市场情况的稳定性而有所不同。
- 未来工作包括尝试更新的Q-Learning策略和探索替代经济指标用于训练模型。
➡️