小红花·文摘

这项研究提出了两个新的度量标准，用于量化大型语言模型解释的不确定性。实证分析发现，口头化不确定性不可靠，而探测不确定性与解释的忠实度相关。这项研究为量化LLM解释的不确定性带来了洞察，有助于探讨基础模型的可靠性。