该文提出了一个基于概念的解释性方法的框架,并将其扩展到NLP领域。通过从预训练模型的隐藏层激活中提取具有预测高水平特征(概念),优化具有高影响力的特征的存在,并设立了多种评估指标。实验结果表明,该方法在预测影响、可用性和忠实度方面都取得了卓越的结果。
正在访问的资源需要验证您是否真人。
或在微信中搜索公众号“小红花技术领袖”并关注
第二步:在公众号对话中发送验证码: