在线最优执行策略的深度强化学习
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
本研究提出了一种基于深度确定性策略梯度(DDPG)的新算法,用于解决动态金融市场中学习非马尔可夫最优执行策略的问题。该算法通过建模瞬时价格影响,逼近最优策略,适应市场变化,减少人为干预。实验验证了其有效性。
🎯
关键要点
- 本研究提出了一种新算法,基于深度确定性策略梯度(DDPG)。
- 该算法旨在解决动态金融市场中学习非马尔可夫最优执行策略的问题。
- 算法通过建模瞬时价格影响,逼近最优策略。
- 该算法能够适应市场变化,减少人为干预。
- 实验验证了算法的有效性。
➡️