这项研究提出了两个新的度量标准,用于量化大型语言模型解释的不确定性。实证分析发现,口头化不确定性不可靠,而探测不确定性与解释的忠实度相关。这项研究为量化LLM解释的不确定性带来了洞察,有助于探讨基础模型的可靠性。
完成下面两步后,将自动完成登录并继续当前操作。