小红花·文摘

本研究利用深度强化学习技术优化期权定价和行权策略，C51算法实现了8%的超额回报。研究还探讨了分布强化学习中的分位回归及其算法，提出了新型动态对冲模型，并结合Black-Litterman模型提升投资组合回报，展示了深度强化学习在金融领域的有效性和潜力。