鲁棒反事实解释中的一般模型变化

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文提出了一种新的深度学习模型反事实解释鲁棒性评估框架,通过考虑模型变化提供紧密估计和强有力的保证。实验证明该方法优于现有技术。

🎯

关键要点

  • 研究深度学习模型反事实解释的鲁棒性评估问题。
  • 提出了一种新的框架,重点考虑模型变化对鲁棒性的影响。
  • 首次展示反事实对于模型变化的鲁棒性计算是 NP 完全的。
  • 提出了一种新的概率方法,提供鲁棒性的紧密估计和强有力的保证。
  • 该方法不对网络提出要求,适用于更广泛的架构。
  • 在四个二分类数据集上的实验表明,该方法在生成鲁棒解释方面优于现有技术。
➡️

继续阅读