文章介绍了一种顺序决策代理,目标是最大化随时间变化的未知函数。代理在每步接收观测值,并需在高概率下做出安全决策。提出的策略结合贝叶斯优化和变点检测,解决安全顺序优化问题,主要挑战是识别变点时的安全决策,避免局部最优。
完成下面两步后,将自动完成登录并继续当前操作。