本文介绍了一种基于组合多臂赌博机的在线决策框架,考虑了测试成本,并通过后验抽样或BayesUCB进行探索。该框架经过理论分析和实验验证,证明了在实际问题中的适用性。
完成下面两步后,将自动完成登录并继续当前操作。