软件定义网络中的对抗深度强化学习在网络安全中的应用
原文约300字/词,阅读约需1分钟。发表于: 。该研究聚焦于利用自主攻击性方法在深度强化学习 (DRL) 中提升训练的鲁棒性,并探索在软件定义网络 (SDN) 中将对抗学习应用于 DRL 以实现自主安全性的影响。通过比较两个算法,DDQN 和 NEC2DQN(或 N2D),发现通过引入因果性攻击来实施对抗学习,算法仍能根据自身的具体优势保护网络。
本文介绍了针对强化学习的对抗攻击,提高了深度强化学习算法对参数不确定性的鲁棒性。作者展示了简单的攻击可以降低算法性能,并使用梯度信息改进了攻击方法,进一步降低性能。这些攻击方法用于训练中,提高了RL控制框架的鲁棒性。作者在多个RL基准测试环境中展示了对抗训练可以显著提高DRL算法对参数变化的鲁棒性。