本研究提出了一种新的实体级虚构检测方法,旨在解决大语言模型生成虚构内容的不足。通过构建HalluEntity数据集,评估17种现代大语言模型的基于不确定性的方法,发现现有方法在预测虚构内容时存在过度预测的问题,并指出未来研究方向。
该研究提出了一种在零镜头环境中检测虚构的框架,准确度达到0.78,并介绍了多模态幻觉检测数据集M-HalDetect。研究利用新方法减少幻觉率,推动文本到视频生成技术的发展,并提出了针对视觉幻觉的新型检测系统,显著改善了识别效果。
完成下面两步后,将自动完成登录并继续当前操作。