资源有限的母婴护理中的生命体征监测优化:基于强化学习的休眠多臂赌博机方法
发表于: 。本研究针对当前母婴护理中生命体征监测资源不足的问题,提出了一种新颖的分配算法,采用了休眠多臂赌博机模型,解决了该领域独特的约束条件。通过使用强化学习中的近端策略优化算法进行训练,实验证明该方法在监测效率上显著优于传统基线。
本研究针对当前母婴护理中生命体征监测资源不足的问题,提出了一种新颖的分配算法,采用了休眠多臂赌博机模型,解决了该领域独特的约束条件。通过使用强化学习中的近端策略优化算法进行训练,实验证明该方法在监测效率上显著优于传统基线。