本研究利用深度强化学习技术优化期权定价和行权策略,C51算法实现了8%的超额回报。研究还探讨了分布强化学习中的分位回归及其算法,提出了新型动态对冲模型,并结合Black-Litterman模型提升投资组合回报,展示了深度强化学习在金融领域的有效性和潜力。
完成下面两步后,将自动完成登录并继续当前操作。