DeCoRe:通过对比检索头解码以减轻幻觉现象

💡 原文中文,约500字,阅读约需2分钟。
📝

内容提要

我们提出了一种方法,帮助大型语言模型在适当时选择“我不知道”作为回答。通过自我评估响应相似性和预测技术,我们有效降低了问答中的胡言乱语率,并在不同数据集上保持了较低的放弃率。

🎯

关键要点

  • 提出了一种方法,帮助大型语言模型选择'我不知道'作为回答。
  • 该方法基于自我评估响应相似性和预测技术。
  • 有效降低了问答中的胡言乱语率。
  • 在不同数据集上保持了较低的放弃率。
  • 使用自洽性作为模型置信度度量的基础。
  • 通过语言模型自我评估每个采样响应之间的相似性。
  • 开发了一种放弃回答的方法,具有严格的理论保证。
  • 在实验中,放弃方法有效限制了各种问答数据集的胡言乱语率。
  • 在长答案数据集上保持较低的放弃率,在短答案数据集上实现可比较的性能。
  • 使用阈值相似性函数确定两个答案是否等价,并提供阈值校准的方法。
➡️

继续阅读