Inverse Reinforcement Learning with Switching Rewards and History Dependency for Characterizing Animal Behaviors
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了一种新的反向强化学习框架SWIRL,解决了传统方法无法捕捉动物历史依赖的问题。该模型结合时间变化和历史依赖的奖励函数,更准确地描述复杂的动物决策过程,并在多个数据集上优于传统模型。
🎯
关键要点
- 本研究提出了一种新的反向强化学习框架SWIRL。
- SWIRL框架结合了时间变化和历史依赖的奖励函数。
- 该模型能够更准确地描述复杂的动物决策过程。
- SWIRL在多个数据集上优于传统模型,解决了历史依赖问题。
➡️