小红花·文摘

本研究提出了一种新的实体级虚构检测方法，旨在解决大语言模型生成虚构内容的不足。通过构建HalluEntity数据集，评估17种现代大语言模型的基于不确定性的方法，发现现有方法在预测虚构内容时存在过度预测的问题，并指出未来研究方向。

BriefGPT - AI 论文速递 ·

该研究提出了一种在零镜头环境中检测虚构的框架，准确度达到0.78，并介绍了多模态幻觉检测数据集M-HalDetect。研究利用新方法减少幻觉率，推动文本到视频生成技术的发展，并提出了针对视觉幻觉的新型检测系统，显著改善了识别效果。

BriefGPT - AI 论文速递 ·