最大化学习性能同时保证解释性的集成

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

本文提出了通过敌对训练生成稳健高保真黑盒模型解释的新框架。实验结果显示该方法在分布偏移下具有稳定性和鲁棒性,且不牺牲解释保真度。

🎯

关键要点

  • 提出了一个生成稳健且高保真黑盒模型解释的新框架。
  • 该框架通过敌对训练的方法来解决现有算法在分布偏移下缺乏稳定性和鲁棒性的问题。
  • 这是首次尝试生成对一类有实际意义的敌对扰动具有鲁棒性的后续解释。
  • 实验结果显示该方法显著提高了解释的鲁棒性。
  • 该方法在原始数据分布上不牺牲解释的保真度。
➡️

继续阅读