I Don't Know: Explicit Modeling of Uncertainty Using the [IDK] Token
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了一种新校准方法,通过在大型语言模型中添加[IDK]标记,明确表达不确定性,从而减少生成文本中的错误预测,并对知识编码的影响较小。
🎯
关键要点
- 本研究提出了一种新校准方法,旨在解决大型语言模型生成文本时的幻觉和不准确内容问题。
- 新方法通过在模型词汇中添加[IDK]标记,明确表达模型的不确定性。
- 研究结果表明,该方法能够减少生成文本中的错误预测。
- 该方法对模型的知识编码影响较小。
➡️