该研究提出了一种基于最优传输理论的风险感知强化学习框架,以确保决策的可靠性和尊重风险约束。该框架平衡了奖励追求和风险意识,为强化学习提供了一个有前景的方向。
完成下面两步后,将自动完成登录并继续当前操作。