本研究探讨大型语言模型(LLMs)的幻觉现象,评估其在重述和翻译任务中的幻觉检测能力。结果表明,不同任务和语言下模型表现存在差异,但在特定提示下表现一致,自然语言推理模型的检测能力尤为突出,表明LLM检测方法并非唯一选择。
正在访问的资源需要验证您是否真人。
或在微信中搜索公众号“小红花技术领袖”并关注
第二步:在公众号对话中发送验证码: