二人强化学习

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文介绍了一种基于上下文因素和目标人以及他们的照顾伙伴的过去反应的在线强化学习算法 - 双人强化学习,旨在个性化干预传递,提高社会支持。通过模拟研究,我们展示了双人强化学习的实证绩效。

🎯

关键要点

  • 本文介绍了一种在线强化学习算法,称为双人强化学习。
  • 该算法基于上下文因素和目标人及其照顾伙伴的过去反应。
  • 双人强化学习旨在个性化干预传递,提高社会支持。
  • 通过模拟研究,展示了双人强化学习的实证绩效。
  • 研究使用了玩具场景和移动健康研究中收集的实际数据。
➡️

继续阅读