基于 Q 学习的概率布尔控制网络的最优虚假数据注入攻击
原文中文,约300字,阅读约需1分钟。发表于: 。通过采用强化学习方法(特别是 Q-learning 算法),解决了在概率布尔控制网络中,攻击者模型不可知情况下的最优虚假数据注入问题,并提出了一种改进的 QL 算法,能够处理标准 QL 算法无法处理的大规模 PBCNs 并获取最优攻击策略,并通过两个被攻击的 PBCN 网络验证了我们提出方法的有效性。
本文研究了恶意篡改成本信号下的强化学习,通过对 Q-learning 的研究,证明了其在隐蔽攻击和成本信号有限篡改下仍能收敛。提出了鲁棒的代价区间,给出了关于篡改代价的条件,最后通过案例研究展示了强化学习的潜在危险。