小红花·文摘

本文研究了基于线性奖励的鲁棒最佳臂识别问题（RBAI），提出了基于实例的线性奖励的鲁棒最佳臂识别问题的下界，并提出了静态和自适应赌博算法。在合成实验中，算法有效地识别出最佳的鲁棒臂，并与“预言家”策略表现相似。在糖尿病护理和胰岛素剂量建议方面，算法证明了其有效性。