本文提出了一种混合方法来解决安全关键环境中的复杂合作任务,通过整合多智能体增强学习和控制理论方法。实验证明该方法在任务性能和安全违规方面取得了显著优势。
该研究提出了一种控制理论方法,通过加入可控性约束来增强数据估计的模型,从而实现从数据中提取更有效的控制器。该方法基于深度神经网络的模型估计,并在两个标准经典控制系统中证明了其优势。
完成下面两步后,将自动完成登录并继续当前操作。