DiaHalu是第一个基于对话级别的幻觉评估基准,通过整合主题和对话模拟真实的人机互动场景。该数据集对大型语言模型和检测方法具有挑战性,对进一步研究有重要价值。
完成下面两步后,将自动完成登录并继续当前操作。