二人强化å¦ä¹ 原文约300字,阅读约需1分钟。发表于:2023-08-15T00:00:00Z。 本文介绍了一种基于上下文因素和目标人以及他们的照顾伙伴的过去反应的在线强化学习算法 - 双人强化学习,旨在个性化干预传递,提高社会支持。通过在玩具场景和移动健康研究中收集的实际数据的模拟研究,我们展示了双人强化学习的实证绩效。 本文介绍了一种基于上下文因素和目标人以及他们的照顾伙伴的过去反应的在线强化学习算法 - 双人强化学习,旨在个性化干预传递,提高社会支持。通过模拟研究,我们展示了双人强化学习的实证绩效。 上下文因素 个性化干预 双人强化学习 目标人 社会支持