语言模型可解释性的全局到局部支持谱
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
本文介绍了广义代表器,一种基于样本的机器学习模型解释通用类。该模型使用两个组件来衡量训练样本对模型测试预测的影响,并满足一组自然公理属性。实证比较表明,广义代表器在图像分类和文本分类数据集上表现良好。
🎯
关键要点
- 提出了一种称为广义代表器的基于样本的机器学习模型解释的通用类。
- 广义代表器使用两个组件:度量训练点对模型的重要性和使用核函数衡量训练样本与测试点的相似性。
- 广义代表器是唯一满足一组自然公理属性的基于样本的解释类。
- 讨论了在给定核函数情况下提取全局重要性的方法。
- 展示了许多现有样本解释可以视为使用特定核函数的广义代表器。
- 对两个图像分类数据集和两个文本分类数据集进行了实证比较,广义代表器表现良好。
➡️