小红花·文摘

该文章介绍了一种在已训练但不可解释的神经网络上进行基于概念的干预的方法，并通过微调模型来改进干预效果和提高预测的校准性。实验结果显示，精调黑盒模型在干预效果上与概念瓶颈模型相媲美且性能更高。