本文提出了一种新的状态对抗性马尔可夫博弈模型,解决了现有方法在状态不确定性下的问题,并提出了一种新的鲁棒性算法RMA3C。实验结果显示该算法对状态扰动的鲁棒性更高。
完成下面两步后,将自动完成登录并继续当前操作。