MedHallu:用于检测大语言模型医疗幻觉的综合基准

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本文提出了医疗幻觉检测基准MedHallu,包含1万对问答。研究表明,现有模型在幻觉检测方面表现不足,引入领域知识和“无确定答案”选项可显著提升检测精度。

🎯

关键要点

  • 提出了医疗幻觉检测基准MedHallu,包含1万对问答。

  • 研究表明现有模型在幻觉检测方面表现不足。

  • 引入领域知识和“无确定答案”选项可显著提升检测精度。

➡️

继续阅读