该文介绍了一种合作多智能体多臂赌博游戏中的攻击策略,通过针对一个智能体,使所有智能体在选择一个特定目标臂时承担攻击成本,从而影响其他智能体的决策。该攻击策略需要具有线性攻击成本,并可以迫使最大数量的智能体遭受线性遗憾。数值实验证实了该攻击策略的有效性。
完成下面两步后,将自动完成登录并继续当前操作。