Inverse Reinforcement Learning with Switching Rewards and History Dependency for Characterizing Animal Behaviors

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出了一种新的反向强化学习框架SWIRL,解决了传统方法无法捕捉动物历史依赖的问题。该模型结合时间变化和历史依赖的奖励函数,更准确地描述复杂的动物决策过程,并在多个数据集上优于传统模型。

🎯

关键要点

  • 本研究提出了一种新的反向强化学习框架SWIRL。
  • SWIRL框架结合了时间变化和历史依赖的奖励函数。
  • 该模型能够更准确地描述复杂的动物决策过程。
  • SWIRL在多个数据集上优于传统模型,解决了历史依赖问题。
➡️

继续阅读