本研究提出了一个评估大型语言模型透明性和可信性的框架,采用人类推理一致性等四个指标。结果显示,LIME方法在多个模型中表现优异,人类推理一致性得分高达0.9685。
完成下面两步后,将自动完成登录并继续当前操作。