小红花·文摘

一分钟读论文：《MASS-RAG：多智能体协同的检索增强生成》

Micropaper ·

通过信心标记学习路由大型语言模型

Apple Machine Learning Research ·

RAG（检索增强生成）系统通过上下文压缩技术提高检索效率和答案准确性。上下文压缩包括选择性保留、摘要和句子抽取三种方式，能有效减少无关信息。通过预处理、向量化、压缩和生成答案，RAG系统优化文档处理，节省内存并加快推理速度。

爆改RAG！用“上下文压缩”让你的AI检索系统又快又准

dotNET跨平台 ·

本研究质疑大语言模型对最终答案的依赖，提出通过分析中间推理步骤来提高答案准确性，实验验证了该方法在多个模型和数学推理数据集上的有效性。

Beyond the Final Answer: Your Reasoning Path Reveals More

BriefGPT - AI 论文速递 ·

本研究分析了大型语言模型（LLM）在多跳问题回答中的解码方法，提出结合ReAct框架与解码策略以提高答案准确性，特别是在推理和外部知识获取方面，解决了因事实不准确导致的“幻觉”现象。

An Analysis of Decoding Methods for Multi-Hop Question Answering Based on Large Language Models

BriefGPT - AI 论文速递 ·

本研究提出FANS框架，旨在提升大语言模型在自然语言数学推理中的推理能力和答案准确性。通过将数学问题转化为Lean4定理，并利用Lean4证明器验证答案，显著提高了答案选择的准确性。

FANS - Formal Answer Selection for Natural Language Math Reasoning Based on Lean4

BriefGPT - AI 论文速递 ·

本研究提出了一种新型的RAG系统，通过引入评估模块，提高了在大数据环境下的答案准确性和效率，为高精度问答应用奠定了基础。

Semantic Tagging in Retrieval-Augmented Generation

BriefGPT - AI 论文速递 ·

该论文探讨了无摘录机器阅读理解（MRC）的多种策略和模型，包括双向阅读、高亮显示和自我评估。提出的卷积空间注意力（CSA）模型在RACE和SemEval-2018数据集上显著提升了性能。研究分析了MRC数据的词汇歧义和答案准确性，强调未来数据集需评估上下文相关性，并指出现有模型与人类理解能力仍有差距，提出未来研究方向。

可视化机器阅读理解模型中的注意力区域

BriefGPT - AI 论文速递 ·

本研究提出了MedLogic-AQA，一个新型医学问答系统，旨在改善对复杂医疗查询的逻辑结构理解。该系统通过提取一阶逻辑规则，能够生成更准确、完整的答案，实验证明其有效提升了问答质量和信息量。

MedLogic-AQA: An Abstractive Model for Enhancing Medical Question Answering Based on Logical Structures

BriefGPT - AI 论文速递 ·

本文介绍了一种自适应检索增强生成法（ARAG），旨在提高信息检索的效率和相关性。研究提出了基准测试集RetrievalQA，包含1,271个问题，以评估检索的必要性。提出的Time-Aware Adaptive Retrieval（TA-ARE）方法无需校准或额外训练，能有效评估检索需求。此外，研究还提出了Dynamic-Relevant Retrieval-Augmented Generation（DR-RAG）框架，显著提高了答案的准确性和检索效率。

多样化-验证-适应：高效且稳健的检索增强模糊问题回答

BriefGPT - AI 论文速递 ·

The GraphRAG Manifesto: 为生成式 AI 增加知识 - 图数据库与分析 [译]

宝玉的分享 ·

本文介绍了新型问题回答管道BeamSearchQA，利用大型语言模型生成新问题以提升推理能力，实验表明其在开放性问题回答中优于传统方法。同时，提出了LLMQA框架，结合检索与生成的优势，优化了答案的准确性和证据质量，展示了在问答研究中的潜力。

实体驱动的答案集扩展用于问答评估

BriefGPT - AI 论文速递 ·

该研究提出了一种多模态CoT框架，结合语言与视觉信息，显著提高了答案推断的准确性，超越了GPT-3.5。通过知识图谱评估LLMs的推理能力，发现生成的连贯思路与答案准确性存在差异。Faithful CoT框架和概率思维树推理方法在多个数据集上表现优越，验证了外部知识在推理中的重要性。

CoTAR: 用多级细粒度的链式思维归因推理

BriefGPT - AI 论文速递 ·

最近的大型语言模型 (LLMs) 的进展使得思维链 (CoT) 提醒的紧急能力增加。为了设计 LLM 提示，有一个重要的设置，称为演示选择。我们介绍了一种新方法，称为推理技能发现 (RSD)，它使用无监督学习创建合理性的潜在空间表示，同时学习一个推理策略来确定给定问题所需的推理技能。RSD 在多个推理任务中的答案准确性方面优于现有方法多达 6%。

代码提示引发了文本 + 代码模型的条件推理能力

BriefGPT - AI 论文速递 ·