基于逆变器的部分可观测配电网络中的稳健深度强化学习电压-无功控制
原文中文,约300字,阅读约需1分钟。发表于: 。本研究解决了在配电网络中测量部署有限导致的部分可观测状态和未知奖励的问题,提出了一种稳健的深度强化学习方法。通过保守性评价器和替代奖励的创新设计,该方法优化了整个网络的功率损耗和可测量的节点电压,显著提高了控制策略的鲁棒性。模拟结果表明,即使在只有根节点的有功功率注入和不足10%的节点电压可测量的情况下,所提方法仍表现出良好的有效性。
本研究提出了一种稳健的深度强化学习方法,解决了配电网络中部分可观测状态和未知奖励的问题。该方法通过优化功率损耗和可测量的节点电压,提高了控制策略的鲁棒性。模拟结果表明,即使在只有根节点的有功功率注入和不足10%的节点电压可测量的情况下,所提方法仍表现出良好的有效性。