小红花·文摘

本研究提出了RetroLLM框架，旨在解决大型语言模型生成过程中的幻觉问题。通过整合检索与生成，RetroLLM引入层次FM-Index约束和前瞻性解码策略，显著提高生成证据的准确性和相关性，超越现有方法在开放领域问答数据集上的表现。

RetroLLM: Empowering Large Language Models to Retrieve Fine-grained Evidence during Generation

BriefGPT - AI 论文速递 ·

本文提出了一种名为SpARE的无训练表征工程方法，旨在解决大型语言模型中的上下文与参数化知识冲突问题。通过利用预训练的稀疏自编码器，SpARE能够有效控制知识选择行为，从而在开放领域问答任务中显著提升模型性能。

Steering Knowledge Selection Behaviors in Large Language Models via SAE-Based Representation Engineering

BriefGPT - AI 论文速递 ·

本研究通过创建QACC数据集，分析大型语言模型在开放领域问答中因冲突信息导致的准确性问题，并提出微调模型的新方法。结果显示，适当微调能增强推理能力，提高问答效果。

Question Answering with Conflicting Information in Open Domains

BriefGPT - AI 论文速递 ·

本文探讨了检索增强生成（RAG）在大型语言模型（LLMs）中的应用，强调其在长上下文任务中的优势。研究表明，简单的检索增强方法在计算量较小的情况下，能够达到与微调模型相似的性能。提出的REAR方法通过改进检索文档的相关性评估，显著提升了开放领域问答的效果。文章总结了RAG的评估方法及未来研究方向，强调其在提高LLMs准确性和可靠性方面的潜力。

利用精细调优的检索增强生成技术支持长上下文: 适用于3GPP标准

BriefGPT - AI 论文速递 ·

本文探讨了在开放领域问答任务中，利用检索增强生成技术提升大型语言模型性能的方法。研究表明，检索增强显著提高了模型在长上下文任务中的表现，尤其是LLaMA2-70B模型的效果优于其他基线模型。此外，通过优化算法和新方法GenRead，信息提取的准确性得到了提升，展示了检索式方法的优势。

优化检索增强生成环境中的异常检测

BriefGPT - AI 论文速递 ·

迈向稳健评估：大型语言模型时代开放领域问答的数据集和评估指标的综合分类法

Apple Machine Learning Research ·

本文探讨了通过Prompt-based Fine-tuning技术提升语言模型和多模式因果变换器的效果，利用35%-40%的训练数据集实现显著的时间和费用节约。研究提出的开放领域问答系统通过无监督问题生成和数据增强，提高了模型的准确性和效率，并在多个数据集上取得了优异的结果。

基于提示的少样本问答合成数据生成

BriefGPT - AI 论文速递 ·

本文介绍了一种增强检索的生成方法（GAR），通过生成相关语境提升开放领域问答的效果。GAR在多个数据集上优于传统检索算法，并结合迁移学习和多阶段关注机制，显著提高问答系统性能。研究表明，检索与生成的结合有效改善大型语言模型的推理能力和生成质量。

通过向量化上下文改进基于检索的开放领域问答

BriefGPT - AI 论文速递 ·

该论文探讨了通过检索增强生成（RAG）和迁移学习提升教科书问答的推理能力。对Llama-2模型的微调使验证集和测试集的准确率分别提升了4.12%和9.84%。文中总结了RAG的三种范式及评估方法，并提出了基于时间感知的自适应检索方法（TA-ARE）以提高检索效率。此外，研究介绍了LLMQA框架，结合检索与生成的优势，提升开放领域问答的准确性和证据质量。

自适应 - RAG: 通过问题复杂性学习适应检索增强大型语言模型

BriefGPT - AI 论文速递 ·

开放领域问答（ODQA）研究中提出了LLMQA框架，该框架结合了检索和生成方法，分为查询扩展、文档选择和答案生成三个步骤。实验结果显示，LLMQA在答案准确性和证据质量方面表现优异，推动了ODQA的研究与应用。

Dr3: 对大型语言模型在开放领域多跳问答中不给出题外答案的要求

BriefGPT - AI 论文速递 ·

知识密集型自然语言处理任务的检索增强生成技术研究 [译]

宝玉的分享 ·

该研究提出了一种基于知识库和相关文章文本联合的开放领域问答方法，通过更新文本段落表示实现了在三个任务数据集上2-11%的性能提升。

开放领域问答中的负面背景

BriefGPT - AI 论文速递 ·