自主网络防御代理的实证博弈论分析
📝
内容提要
该研究解决了网络攻击日益复杂所带来的自主网络防御(ACD)代理的鲁棒性和可确保性挑战。文章提出了一种基于原则双oracle(DO)算法的深度强化学习(DRL)方法,并引入潜在奖励塑形以加速学习过程。同时,扩展了DO框架以支持多响应oracle(MRO),为ACD方法的全面评估提供了基础。
➡️
该研究解决了网络攻击日益复杂所带来的自主网络防御(ACD)代理的鲁棒性和可确保性挑战。文章提出了一种基于原则双oracle(DO)算法的深度强化学习(DRL)方法,并引入潜在奖励塑形以加速学习过程。同时,扩展了DO框架以支持多响应oracle(MRO),为ACD方法的全面评估提供了基础。