C-FAITH: An Automated Chinese Fine-Grained Benchmark for Hallucination Evaluation
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出HaluAgent框架,构建细粒度问答数据集C-FAITH,以解决大型语言模型生成幻觉的评估不足,提升评估效率,推动相关研究进展。
🎯
关键要点
- 本研究提出HaluAgent框架。
- 构建细粒度问答数据集C-FAITH。
- 解决大型语言模型生成幻觉的评估不足。
- 提升评估效率,推动相关研究进展。
- 实验结果表明该基准能够有效评估主流大型语言模型的性能。
➡️