MetaCheckGPT:使用 LLM 不确定性和元模型的多任务幻觉检测
原文中文,约200字,阅读约需1分钟。发表于: 。我们提出了一个基于大语言模型 (LLMs) 的元回归框架,用于模型评估和集成,在 SemEval-2024 Task 6 竞赛中取得最高得分。我们的方法利用多样的 LLMs 中存在的不确定信号更可靠地检测幻觉。
研究提出了新的元评估基准(MHaluBench)和统一多模态幻觉检测框架(UNIHD),以促进幻觉检测方法的发展。
我们提出了一个基于大语言模型 (LLMs) 的元回归框架,用于模型评估和集成,在 SemEval-2024 Task 6 竞赛中取得最高得分。我们的方法利用多样的 LLMs 中存在的不确定信号更可靠地检测幻觉。
研究提出了新的元评估基准(MHaluBench)和统一多模态幻觉检测框架(UNIHD),以促进幻觉检测方法的发展。