小红花·文摘

本研究探讨了生成型大型语言模型（LLMs）产生幻觉的问题，提出了HALoGEN基准，包含来自九个领域的10,923个提示及其验证器。研究发现，表现最佳的模型中有86%的生成事实存在幻觉，并建立了新的幻觉错误分类体系。

HALoGEN: The Fascinating Illusions of LLMs and Their Origins

BriefGPT - AI 论文速递 ·

本文探讨了文本分类模型中的隐私保护挑战，提出利用生成型语言模型提取训练数据的算法，评估未经同意使用个人数据的风险。研究表明，差分隐私技术有效但性能有限，强调需基于公共数据训练模型以保护用户隐私。同时，提出新型数据重构攻击方法，并分析隐私分类器的防御策略。

通过令牌操作保护分类器中的隐私

BriefGPT - AI 论文速递 ·

本文探讨了生成型大型语言模型（如GPT-4）在教育领域的应用，特别是在短答阅读理解和自动评分方面的潜力。研究表明，GPT-4在生成高质量测试和评估学生表现方面表现优异，且与人工评分结果高度相关。文章还分析了现有评估方法的不足，提出了新的评分系统RWQ-Elo，并强调了大型语言模型在教育反馈中的重要性和挑战。

大型语言模型自动生成与评估阅读理解测试题

BriefGPT - AI 论文速递 ·

该研究提出了TRIGO，用于评估生成型语言模型在公式推理、数字项操作、分组和因式分解方面的推理能力。实验结果显示，TRIGO对于包括在大量开源形式定理证明语言数据上预训练的GPT-4在内的先进生成型语言模型提出了新的挑战。

TRIGO：用于生成语言模型的形式化数学证明简化的基准测试

BriefGPT - AI 论文速递 ·