HVAC系统控制的持续强化学习:集成超网络和迁移学习
📝
内容提要
本研究针对传统HVAC系统控制中样本效率低和泛化能力不足的问题,提出了一种基于模型的强化学习框架,利用超网络在不同任务中持续学习环境动态。这种方法显著提高了合成滚动生成的效率,并在多任务设置中实现了强有力的向后迁移,既减少了能源消耗,也降低了运营成本,从而对全球可持续发展目标产生重要影响。
🏷️
标签
➡️