RL2Grid：强化学习在电网运营中的基准测试

本研究针对现有强化学习方法在复杂电网系统中的不足，提出了RL2Grid基准，以加速电网控制的进展。该方法结合电力系统操作人员的专业知识，标准化任务和奖励结构，评估主流强化学习算法的性能。研究表明，电网对强化学习方法的挑战需要新算法的支持，以应对现实世界的物理系统。

基准测试强化学习

发表于：。