学习的非马尔可夫安全性约束下的安全强化学习

BriefGPT - AI 论文速递 BriefGPT - AI 论文速递 ·

该研究提出了一种新的方法,使用pSTL安全规范和小规模初始标记数据集,学习安全的强化学习控制策略并识别未知的安全约束参数。实验证实了该方法在各种环境约束形式上的有效性,并成功学习了与真实环境安全约束高度一致的STL安全约束参数。

原文中文,约400字,阅读约需1分钟。
阅读原文