本研究探讨了人工智能领域缺乏正式理论的问题,提出因果系统理论框架,强调知识的“为什么”在预测外部干预效果中的重要性。
本文提出了一种算法,在因果系统中的线性结构方程模型中实现几乎最优的累积遗憾,即使在更广泛的模型波动下也能保持次线性遗憾。同时,讨论了连续干预的序贯设计对累积遗憾的稳健性。
完成下面两步后,将自动完成登录并继续当前操作。