小红花·文摘

文章介绍了一种顺序决策代理，目标是最大化随时间变化的未知函数。代理在每步接收观测值，并需在高概率下做出安全决策。提出的策略结合贝叶斯优化和变点检测，解决安全顺序优化问题，主要挑战是识别变点时的安全决策，避免局部最优。