SDGym: 使用系统动力学模型的低代码强化学习环境

原文约200字,阅读约需1分钟。发表于:

通过引入系统动态方法(SD)作为一种补充方法,利用 SDGym 生成基于 SD 模拟模型的定制强化学习(RL)环境,验证了通过预先存在的 SD 模型和少量的配置代码可以生成良好指定、丰富的 RL 环境。

本文介绍了应用RL/DRL实现网络运营中的自主智能体,并提出了名为CyGIL的训练环境,旨在从仿真到现实实现自主智能体应用。

相关推荐 去reddit讨论