研究探讨了在预算限制下,机器学习模型如何适应连续任务中的决策变化。提出的上下文赌博机模型在理论上保证了适应性,并在实际数据集上表现出显著性能提升,减轻了专家决策负担,提高了自动决策的可靠性。
完成下面两步后,将自动完成登录并继续当前操作。