本文研究了在线控制未知动态的时变线性系统,提出了一种高效的干扰响应算法,并证明了其适应性悔恨界的优势。同时,探讨了在已知嘈杂动力学下的线性时不变系统的在线学习算法,提出了新的控制器参数化方法,以提高控制效果并实现次线性遗憾。
完成下面两步后,将自动完成登录并继续当前操作。