鲁棒反事实解释中的一般模型变化
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文提出了一种新的深度学习模型反事实解释鲁棒性评估框架,通过考虑模型变化提供紧密估计和强有力的保证。实验证明该方法优于现有技术。
🎯
关键要点
- 研究深度学习模型反事实解释的鲁棒性评估问题。
- 提出了一种新的框架,重点考虑模型变化对鲁棒性的影响。
- 首次展示反事实对于模型变化的鲁棒性计算是 NP 完全的。
- 提出了一种新的概率方法,提供鲁棒性的紧密估计和强有力的保证。
- 该方法不对网络提出要求,适用于更广泛的架构。
- 在四个二分类数据集上的实验表明,该方法在生成鲁棒解释方面优于现有技术。
➡️