本研究提出了SMOSE方法,旨在解决连续控制任务中的可解释性问题。SMOSE结合多个具有不同技能的可解释决策者和路由器,显著提高了解释便利性,并在多个基准环境中超越了现有可解释基线,缩小了与非可解释算法的差距。
完成下面两步后,将自动完成登录并继续当前操作。