小红花·文摘 - 小红花技术领袖俱乐部

研究人员提出多种置信度估计技术来解决大型语言模型的事实准确性问题。实验显示，隐藏状态探针提供了最可靠的置信度估计，但需要权重和训练数据。模型在语义等效输入下的置信度不稳定，表明模型参数化知识的稳定性有待提高。

使用信心标记进行路由学习

BriefGPT - AI 论文速递 ·

研究人员提出了技术来估计大型语言模型的置信度，发现训练的隐藏状态探针提供了最可靠的置信度估计，但需要权重和训练数据。模型在语义等效的输入中不稳定，改进模型参数化知识的稳定性有改进空间。

不自信的大型语言模型注释能否用于自信的结论？

BriefGPT - AI 论文速递 ·

研究人员提出了技术来估计大型语言模型的置信度，发现训练的隐藏状态探针提供了最可靠的置信度估计，但需要权重和训练数据。模型在语义等效的输入中不稳定，改进模型参数化知识的稳定性有改进空间。

大型语言模型在其概率或口头信心中的诚实性比较

BriefGPT - AI 论文速递 ·

研究人员提出了技术来估计大型语言模型的置信度，发现训练的隐藏状态探针提供了最可靠的置信度估计，但需要权重和训练数据。模型在语义等效的输入中不稳定，改进模型参数化知识的稳定性有改进空间。

关于对大型语言模型的置信度归属

BriefGPT - AI 论文速递 ·