小红花·文摘

本研究提出了一个评估大型语言模型透明性和可信性的框架，采用人类推理一致性等四个指标。结果显示，LIME方法在多个模型中表现优异，人类推理一致性得分高达0.9685。