层次强化学习用于时间模式预测
原文中文,约300字,阅读约需1分钟。发表于: 。我们探索了使用分层强化学习(HRL)来预测时间序列的任务。结合深度学习和分层强化学习的方法,我们开发了一个股票智能体来预测历史股价数据的时间序列,以及一个车辆智能体来预测第一人称车载摄像头图像中的转向角。我们在两个领域的结果表明,称为封建式强化学习的一种 HRL 方法,在训练速度、稳定性和预测准确性方面都有显著的改进。其中的关键因素是多分辨率结构,将时间和空间抽象引入了网络层次结构。
该文介绍了使用分层强化学习(HRL)预测时间序列的任务。作者结合深度学习和分层强化学习的方法,开发了一个股票智能体和一个车辆智能体,结果表明这种HRL方法在训练速度、稳定性和预测准确性方面都有显著的改进。