本研究提出了一种无模型强化学习方法,旨在优化电网运营并提升稳定性。通过掩蔽拓扑动作空间,代理在20种仿真场景中有效降低电力损耗,促进现代能源系统的自主管理。
完成下面两步后,将自动完成登录并继续当前操作。