小红花·文摘

本研究提出了一种新方法，通过结合局部多样性、行为确定性和全局种群多样性，优化可解释强化学习中的策略演示，显著提升轨迹选择的可解释性，特别在安全性要求高的领域具有重要意义。