DiCE-扩展:机器学习中反事实解释的稳健方法

📝

内容提要

本研究针对现有反事实(CF)生成方法在平衡接近性、多样性和稳健性方面的不足,提出了一种增强的CF解释框架DiCE-Extended,以提高稳健性并保持可解释性。通过引入基于Dice-Sorensen系数的新稳健性度量,该方法在小输入变化下保证了解释的稳定性,实验证明其在多个基准数据集上的有效性和稳定性表现超越标准DiCE生成的解释。

🏷️

标签

➡️

继续阅读