本研究提出了一种基于累积分前景理论的新策略梯度算法,旨在解决传统期望效用理论与人类偏好的不一致问题。该算法在交通控制和电力管理等领域表现优异,展示了广泛的应用潜力。
完成下面两步后,将自动完成登录并继续当前操作。