小红花·文摘

RAG：给模型“外挂知识库”

云原生 ·

Agent设计模式——第 1 章：提示词链

XINDOO的博客 ·

本研究提出了一种基于约束行为空间的强化学习方法，通过整合外部知识来解决组合优化问题，实现更优的图形分区，适用于多个领域。

Using Constraint Behavior Space to Solve Normalized Cutting Problems

BriefGPT - AI 论文速递 ·

本研究探讨大型语言模型（LLMs）在预测暴力冲突方面的能力，发现其预训练权重中包含有意义的参数性知识。通过结合外部信息，模型在冲突趋势和死亡人数预测上显著提升，强调了整合外部知识的重要性。

Do Large Language Models Understand Conflict? Exploring Parametric and Non-Parametric Knowledge of LLMs in Conflict Prediction

BriefGPT - AI 论文速递 ·

本文提出了一种结合思维链与检索增强生成的方法，以解决大型语言模型在复杂任务中产生虚假信息的问题。研究表明，外部知识和自我验证策略的引入显著提升了模型的响应质量和推理深度。

Enhancing the Reliability of Large Language Models: Integrating Chain of Thought, Retrieval-Augmented Generation, Self-Consistency, and Self-Verification

BriefGPT - AI 论文速递 ·

本研究探讨了增强检索生成（RAG）中管理外部知识的挑战，提出了晚分块和上下文检索两种分块技术。结果表明，上下文检索在语义连贯性上表现更佳，但计算资源需求较高；而晚分块效率更高，但可能影响相关性和完整性。

Reconstructing Context: Evaluating Advanced Chunking Strategies for Retrieval-Augmented Generation

BriefGPT - AI 论文速递 ·

生成式AI普遍存在，但大型语言模型（LLM）有时会出现幻觉现象。检索增强生成（RAG）技术通过整合外部知识来提升LLM输出，尤其适用于特定领域知识和数据隐私需求。本文介绍了在本地实现RAG系统的方法，包括查询重写和文档嵌入技术，以提高生成结果的准确性。

带查询增强的Gemini RAG方案

KDnuggets ·

本研究提出了一种三阶段的外部知识增强后续问题生成方法，旨在缩小生成问题与人类提问水平之间的差距。该方法通过识别上下文主题、构建知识图谱并结合大型语言模型，生成更具信息性和探索性的后续问题，实验结果显示其效果接近人类提问。

From Superficial to Deep: Integrating External Knowledge for Follow-up Question Generation Using Knowledge Graphs and Large Language Models

BriefGPT - AI 论文速递 ·

Search-o1是清华与人大合作开发的推理模型框架，通过自主检索外部知识，显著提升推理能力，解决知识不足的问题。实验表明，其在科学、数学和编码等复杂任务中表现优于人类专家，增强了模型的可信度和实用性。

Search版o1：推理过程会主动查资料，整体性能优于人类专家，清华人大出品

量子位 ·

本研究探讨大型语言模型在多跳推理中选取和组合外部知识的能力，发现即使使用思维链提示，模型仍存在显著不足，与人类表现差距较大，为提升推理能力提供了参考。

大型语言模型在多跳推理和外部知识方面仍面临挑战

BriefGPT - AI 论文速递 ·

本文探讨了多种图像字幕生成方法，包括利用外部知识、组合神经模块、kNN记忆和Vision-Language预训练模型，旨在提高字幕生成的准确性和细致度。研究表明，结合外部存储器和优化策略能显著改善字幕质量，尤其在复杂数据集上表现优异，为未来的图像字幕生成提供了新方向。

CAPEEN：带有早期退出和知识蒸馏的图像描述生成

BriefGPT - AI 论文速递 ·

本文探讨通过对手博弈学习和外部知识提升自然语言推断（NLI）模型的鲁棒性，减少假设偏见和虚假关联。研究表明，结合外部知识和对抗性框架能显著提高模型性能，降低自相矛盾解释的风险，并增强模型对微小语义变化的敏感性。

利用解释增强自然语言推理中的对抗鲁棒性

BriefGPT - AI 论文速递 ·

本文介绍了表格问答（Table QA）模型的进展，如T-RAG、ToolWriter和KD-CoT，强调大型语言模型在表格推理中的应用与挑战。研究表明，结合外部知识和改进推理能力的方法能显著提升问答性能，并提出了新的评估基准TableBench，以推动该技术的发展。

寻求与解决推理在表格问答中的应用

BriefGPT - AI 论文速递 ·

本文介绍了预训练语言模型（PLMs）和大型语言模型（LLMs）的最新研究进展，重点讨论了模型的预训练、微调策略及其在不同应用中的表现。研究表明，微调方法与数据量和模型规模密切相关，并提出了优化资源使用的新算法。此外，探讨了将外部知识融入LLMs的技术及其伦理问题，为未来研究提供指导。

大规模语言模型的领域适应微调：训练策略、比例、模型合并及协同能力探索

BriefGPT - AI 论文速递 ·

本文分析了医学生成型问答系统中的幻觉现象，并提出了交互自我反思的方法以减少幻觉。通过“分解和查询”框架，模型在回答问题时有效利用外部知识，降低幻觉风险。实验证明，该方法在多个数据集上优于基线模型，提升了生成文本的准确性和可靠性。

增强证据三元组生成框架用于生成式问答中的幻觉缓解

BriefGPT - AI 论文速递 ·

大型语言模型（LLMs）在时间序列预测中表现优异，尤其是在有明确模式的数据上。研究表明，结合外部知识和自然语言改写可以提升预测性能。通过多模态信号分析，LLMs在金融时间序列预测中优于传统模型。尽管在某些领域已超越人类，LLMs在未来事件预测上仍面临挑战。综述指出，LLMs的应用潜力巨大，但需克服数据依赖和泛化问题等挑战。

大型语言模型的宏观经济预测

BriefGPT - AI 论文速递 ·

本文介绍了多级有监督对比学习框架MultiSCL，该框架在低资源自然语言推理任务中表现优异，准确率比其他模型高3.1%。此外，PairSCL方法在句子对分类中也优于其他方法2.1%。研究表明，结合知识图谱和外部知识能有效提升自然语言推理性能。

基于场景引导适配器的自然语言推理中解决词语模糊问题

BriefGPT - AI 论文速递 ·

本文研究了自然语言理解模型在对话一致性中的应用，提出了DialoguE COntradiction DEtection任务，并创建了新型对话数据集。研究表明，结构化方法在矛盾检测中优于非结构化方法。同时，分析了大型语言模型的自相矛盾现象，并提出了检测和缓解的方法，强调了外部知识在训练中的重要性。

针对矛盾对话的红队语言模型

BriefGPT - AI 论文速递 ·

该研究提出了一种多模态CoT框架，结合语言与视觉信息，显著提高了答案推断的准确性，超越了GPT-3.5。通过知识图谱评估LLMs的推理能力，发现生成的连贯思路与答案准确性存在差异。Faithful CoT框架和概率思维树推理方法在多个数据集上表现优越，验证了外部知识在推理中的重要性。

CoTAR: 用多级细粒度的链式思维归因推理

BriefGPT - AI 论文速递 ·

本文介绍了一种基于GPT模型的命名实体识别（NER）算法GPT-NER，提出了自我验证策略以解决幻觉问题。研究表明，该算法在低资源学习中优于有监督模型，并且结合大型语言模型的混合标注方法能有效提升NER性能，解决类别不平衡问题。多项实验结果证明，引入外部知识和自我改进框架显著提升了NER任务的效果。

LTNER：基于上下文实体标记的大型语言模型命名实体识别

BriefGPT - AI 论文速递 ·