该研究提出了工具SemML,利用机器学习增强基于线性时序逻辑(LTL)的反应系统合成。SemML通过语义标记和机器学习策略,提高了合成效率,实验证明其在解决实例和速度上优于现有方法。
本研究提出了一种无悔的在线强化学习算法,旨在为安全关键系统在未知动态环境中合成控制器。该算法能够有效评估学习过程中接近最佳行为的程度,显著提升基于线性时序逻辑(LTL)规范的任务学习性能与效率。
本文介绍了一种基于线性时序逻辑(LTL)的强化学习方法,旨在解决机器人复杂任务的学习问题。研究提出了多种算法,通过将LTL规范转化为奖励函数,优化策略搜索,增强鲁棒性,并在仿真实验中验证了其有效性。
完成下面两步后,将自动完成登录并继续当前操作。