小红花·文摘

本研究提出了SMOSE方法，旨在解决连续控制任务中的可解释性问题。SMOSE结合多个具有不同技能的可解释决策者和路由器，显著提高了解释便利性，并在多个基准环境中超越了现有可解释基线，缩小了与非可解释算法的差距。