小红花·文摘

本研究提出了SPRIG框架，以解决深度强化学习代理在高维感知环境中协调感知与决策的难题。实验结果显示，SPRIG在Atari BeamRider环境中的表现优于标准PPO，回报率提升约30%。

SPRIG: Stackelberg Perception-Reinforcement Learning with Internal Game Dynamics

BriefGPT - AI 论文速递 ·

本研究解决了Stackelberg一般总和博弈中在线学习的有效性问题，提出了一种新的框架。通过引入学习到的微分同胚，将联合行动空间映射到光滑的黎曼流形上，实现了对在线学习的高效支持，理论上证明了在凸流形上的遗憾最小化，并展示了该方法在网络安全与经济供应链优化等领域的有效应用。

基于神经流表示的Stackelberg博弈黎曼流形学习

BriefGPT - AI 论文速递 ·

本文研究了两人轮流博弈中的均衡计算问题，提出了一种多项式时间算法来计算Stackelberg广泛形式相关均衡（SEFCE），并实现了随机博弈的承诺计算。同时，提供了一种高效算法来近似计算最优广泛形式相关均衡（EFCE），突破了现有算法的局限性。

高效解决具有广泛形式相关性的轮流博弈的随机游戏

BriefGPT - AI 论文速递 ·

本研究提出了一种基于注意力机制的神经算子，解决了动态斯塔克尔博格博弈中跟随者最佳响应的解析求解难题，并在领导者控制集合上实现了近似响应，为复杂博弈提供了新方法。

Neural Operators for Dynamic Stackelberg Games

BriefGPT - AI 论文速递 ·

本文研究了斯塔克伯格博弈中的学习动态及其收敛性，提出了基于梯度的学习更新规则和无遗憾算法，以优化多智能体强化学习。研究探讨了不同博弈设置下的均衡概念及学习代理之间的相互影响。

ReLExS：用于Stackelberg无悔学习者的强化学习解释

BriefGPT - AI 论文速递 ·

应用层次图和斯塔克伯格博弈探讨警方资源有限时打击犯罪分子的有效策略，结果表明该方法在短时间内能够高效解决复杂问题。

在动态犯罪场景中解决交通网络上的 Stackelberg 博弈：多层网络的混合方法

BriefGPT - AI 论文速递 ·

该文介绍了一种学习自动驾驶车辆驾驶模型的框架，通过知识分享和个性化模型，实现多个车辆之间的协作，提高在真实世界中驾驶场景的暴露度。

基于场景的闭环自动驾驶中的 Stackelberg 驾驶员模型的持续策略改进

BriefGPT - AI 论文速递 ·

本文研究了智能电网与插电式电动车群组之间的能量交换问题，并使用非合作博弈模型进行分析。智能电网制定价格以优化收益，并确保插电式电动车群组的参与。插电式电动车群组需要考虑充电收益和成本权衡来确定充电策略。本文提出了一种分布式算法实现智能电网和插电式电动车群组之间的均衡，并扩展到可处理缓慢变化环境的时变情形。

绿色 Metaverses 的服务预订和定价：一种 Stackelberg 博弈方法

BriefGPT - AI 论文速递 ·