该研究提出了一种新的方法,使用pSTL安全规范和小规模初始标记数据集,学习安全的强化学习控制策略并识别未知的安全约束参数。实验证实了该方法在各种环境约束形式上的有效性,并成功学习了与真实环境安全约束高度一致的STL安全约束参数。
正在访问的资源需要验证您是否真人。
或在微信中搜索公众号“小红花技术领袖”并关注
第二步:在公众号对话中发送验证码: