使用 Petri 网作为强化学习任务的集成约束机制
发表于: 。在真实世界的领域,如生产工厂、自动驾驶车辆或交通基础设施中使用强化学习 (RL) 控制代理时,算法的不可信通常是一个问题,部分原因是模型本身的可验证性不足。为了促进 RL 模型的整合并增强人工智能的可信度,我们提出了一种使用 Petri 网 (PNs) 的方法,相比传统的 RL 方法,具有三个主要优势:首先,代理现在可以用一个合并的状态来建模,包括来自给定 PNs...
在真实世界的领域,如生产工厂、自动驾驶车辆或交通基础设施中使用强化学习 (RL) 控制代理时,算法的不可信通常是一个问题,部分原因是模型本身的可验证性不足。为了促进 RL 模型的整合并增强人工智能的可信度,我们提出了一种使用 Petri 网 (PNs) 的方法,相比传统的 RL 方法,具有三个主要优势:首先,代理现在可以用一个合并的状态来建模,包括来自给定 PNs...