小红花·文摘

本研究提出了一种无悔的在线强化学习算法，旨在为安全关键系统在未知动态环境中合成控制器。该算法能够有效评估学习过程中接近最佳行为的程度，显著提升基于线性时序逻辑（LTL）规范的任务学习性能与效率。

BriefGPT - AI 论文速递 ·

本文提出了一种基于超级概率计时逻辑的新方法，解决马尔可夫决策过程中的控制器合成问题，增加了结构约束并显著提升了性能。同时，介绍了一种算法用于学习复杂系统的可解释性描述，并与现有算法进行了比较。此外，研究探讨了超属性形式主义和多参数规范的自动推断，展示了其在实际应用中的有效性。

BriefGPT - AI 论文速递 ·