本文探讨了非线性随机最优控制问题,采用KL最小化方法和近似推理技术进行优化控制计算。研究内容包括线性二次控制问题、鲁棒LQG控制器的样本复杂度、攻击模型对LQG学习者的影响,以及量子LQG控制问题的物理可实现性,提出了多种控制算法和理论保证,以提高对强化学习控制系统安全威胁的认识。
完成下面两步后,将自动完成登录并继续当前操作。