LACIE: 大型语言模型中关注听众的细化调校来增强置信度校准

📝

内容提要

为了解决当前大多数模型过于自信的问题,我们引入了一种称为 LACIE 的训练方法,通过模拟一个听众来校准 LLMs 的内隐和外显置信度标记,实验结果表明,经过 LACIE 训练的模型在置信度上表现得更好,并且 LACIE 方法在其他数据集上也具有泛化能力,并提高了模型对正确与错误示例的分辨能力,并通过包含细节和使用权威语调来暗示正确时的确定性,最后,LACIE 训练导致了模型自动放弃对错误答案的回答。

🏷️

标签

➡️

继续阅读