SPRIG: Stackelberg Perception-Reinforcement Learning with Internal Game Dynamics
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了SPRIG框架,以解决深度强化学习代理在高维感知环境中协调感知与决策的难题。实验结果显示,SPRIG在Atari BeamRider环境中的表现优于标准PPO,回报率提升约30%。
🎯
关键要点
- 本研究提出了SPRIG框架,旨在解决深度强化学习代理在高维感知环境中协调感知与决策的难题。
- SPRIG框架将感知与策略的交互建模为合作的Stackelberg游戏,感知模块作为领导者,策略模块根据提取的特征做出决策。
- 实验结果显示,SPRIG在Atari BeamRider环境中的表现优于标准PPO,回报率提升约30%。
➡️