小红花·文摘

本研究探讨了大型语言模型中的幻觉及生成错误检测，使用自然语言推理微调ModernBERT模型。结果显示，模型信心分数与幻觉之间存在中等正相关，但检测重叠率较低，表明检测的复杂性。