SoNIC是一种结合了自适应符合推断和约束强化学习的算法,用于增强强化学习策略的安全性,避免与行人碰撞。该方法通过引入非符合度分数和安全约束,为机器人提供明确的引导,避免进入安全风险区域。SoNIC在安全性和社会规范方面表现出更高性能,并具有更强的鲁棒性。
该论文提出了一种新的主动故障检测方法,通过将任务分为被动故障检测和控制输入设计两个部分。该方法具有普适性,可以高效利用可用信息并优化信息收集。论文的核心贡献是FIERL,一种通用的基于模拟的方法,用于设计控制策略并通过约束强化学习来优化被动探测器的性能。FIERL在处理复杂的连续故障模式方面具有广泛的适用性。在执行器故障诊断的基准问题上,FIERL表现出相当的鲁棒性并能够泛化到未见过的故障动态。
我们提出了一种新的约束强化学习方法CSAC-LB,通过应用线性平滑对数势函数实现了适应性政策学习的惩罚,解决了数值问题。在不同难度的约束控制任务上实现了最先进的性能,并在真实的四足机器人平台上评估了我们的方法。
完成下面两步后,将自动完成登录并继续当前操作。