本研究提出了一种新的实体级虚构检测方法,旨在解决大语言模型生成虚构内容的不足。通过构建HalluEntity数据集,评估17种现代大语言模型的基于不确定性的方法,发现现有方法在预测虚构内容时存在过度预测的问题,并指出未来研究方向。
完成下面两步后,将自动完成登录并继续当前操作。