本文提出了一种算法,在因果系统中的线性结构方程模型中实现几乎最优的累积遗憾,即使在更广泛的模型波动下也能保持次线性遗憾。同时,讨论了连续干预的序贯设计对累积遗憾的稳健性。
完成下面两步后,将自动完成登录并继续当前操作。