DeCoRe:通过对比检索头解码以减轻幻觉现象
💡
原文中文,约500字,阅读约需2分钟。
📝
内容提要
我们提出了一种方法,帮助大型语言模型在适当时选择“我不知道”作为回答。通过自我评估响应相似性和预测技术,我们有效降低了问答中的胡言乱语率,并在不同数据集上保持了较低的放弃率。
🎯
关键要点
- 提出了一种方法,帮助大型语言模型选择'我不知道'作为回答。
- 该方法基于自我评估响应相似性和预测技术。
- 有效降低了问答中的胡言乱语率。
- 在不同数据集上保持了较低的放弃率。
- 使用自洽性作为模型置信度度量的基础。
- 通过语言模型自我评估每个采样响应之间的相似性。
- 开发了一种放弃回答的方法,具有严格的理论保证。
- 在实验中,放弃方法有效限制了各种问答数据集的胡言乱语率。
- 在长答案数据集上保持较低的放弃率,在短答案数据集上实现可比较的性能。
- 使用阈值相似性函数确定两个答案是否等价,并提供阈值校准的方法。
➡️