SDGym: 使用系统动力学模型的低代码强化学习环境 原文约200字,阅读约需1分钟。发表于:2023-10-19T00:00:00Z。 通过引入系统动态方法(SD)作为一种补充方法,利用 SDGym 生成基于 SD 模拟模型的定制强化学习(RL)环境,验证了通过预先存在的 SD 模型和少量的配置代码可以生成良好指定、丰富的 RL 环境。 本文介绍了应用RL/DRL实现网络运营中的自主智能体,并提出了名为CyGIL的训练环境,旨在从仿真到现实实现自主智能体应用。 仿真 低代码 增强学习 强化学习 深度增强学习 自主智能体 训练环境