小红花·文摘

本文介绍了一种基于上下文因素和目标人以及他们的照顾伙伴的过去反应的在线强化学习算法 - 双人强化学习，旨在个性化干预传递，提高社会支持。通过模拟研究，我们展示了双人强化学习的实证绩效。