小红花·文摘

InfoQ ·

本文探讨了多臂赌博机中的遗憾下界问题，提出了基于不同情境的紧密下界，特别是在强可观测无向反馈图和敌对情境下的算法改进。同时，研究了延迟反馈的多臂老虎机问题，提出新算法以降低对上界的要求，并展示了算法在多种应用场景中的有效性。

BriefGPT - AI 论文速递 ·