捆绑不确定性:强健性和正则化在马尔科夫博弈中
📝
内容提要
我们研究了具有 s - 矩形不确定性的稳健马尔可夫博弈。我们展示了 s - 矩形稳健马尔可夫博弈的稳健纳什均衡和适当构建的正则化马尔可夫博弈的纳什均衡之间的一般等价性。该等价结果为解决 s - 矩形稳健马尔可夫博弈提供了一个规划算法,并对使用正则化方法计算的策略提供了可证明的稳健性保证。然而,我们证明即使对于只有奖励不确定性的二人零和矩阵博弈,计算稳健纳什均衡也是 PPAD...
🏷️
标签
➡️