小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
沉浸式翻译 immersive translate
Dify.AI
通过检索增强生成和多目标对齐统一查询自动补全中的排名与生成

查询自动补全(QAC)是现代搜索系统的重要功能,但现有方法存在挑战。我们提出了一种统一框架,将QAC重构为端到端列表生成,结合检索增强生成(RAG)和多目标直接偏好优化(DPO),通过创新的多目标优化和混合服务架构,显著提升了搜索效率,并验证了其在生产中的有效性。

通过检索增强生成和多目标对齐统一查询自动补全中的排名与生成

Apple Machine Learning Research
Apple Machine Learning Research · 2026-02-18T00:00:00Z
提示工程与检索增强生成(RAG)与微调:为何这不是一条简单的阶梯

大语言模型(LLM)的定制应综合考虑提示工程、检索增强生成(RAG)和微调等不同方法,关注数据隐私、延迟、控制程度、更新频率、部署目标和成本六个维度。成功的架构需在这些维度之间取得平衡,确保系统在实际环境中有效运行,而非单纯依赖最新技术。

提示工程与检索增强生成(RAG)与微调:为何这不是一条简单的阶梯

The New Stack
The New Stack · 2026-01-29T18:00:51Z
如何使用检索增强生成与您的PDF进行对话

大型语言模型虽然能回答问题,但无法直接读取私密文档。检索增强生成(RAG)结合语言模型与用户数据,通过检索文档相关部分来提供答案。本文介绍如何使用LangChain构建后端和简单的React界面,实现与PDF的对话。RAG通过文档分块、生成向量嵌入并检索相关内容,确保答案基于真实数据,适用于处理公司政策和合同等文档。

如何使用检索增强生成与您的PDF进行对话

freeCodeCamp.org
freeCodeCamp.org · 2026-01-27T02:27:57Z
通过小型语言模型(SLM)和检索增强生成(RAG)构建更便宜、更安全、可审计的人工智能

企业结合小型语言模型(SLM)与检索增强生成(RAG)架构,能有效降低基础设施成本,提高响应准确性和可审计性。SLM专注于特定领域,适合企业平台的可持续运行,而RAG通过引用权威数据源增强输出可信度。模块化代理架构使每个代理独立负责特定功能,便于扩展、治理,确保合规性和操作控制。

通过小型语言模型(SLM)和检索增强生成(RAG)构建更便宜、更安全、可审计的人工智能

The New Stack
The New Stack · 2026-01-10T18:00:27Z
DocsGPT - 一个结合检索增强生成(RAG)和多模型的开源企业文档代理平台

DocsGPT是一个开源文档代理平台,支持多种格式(如PDF、DOCX),结合检索增强生成(RAG)和大型语言模型,提供引用支持的答案。适用于企业文档搜索、内部知识助手和合规调查,支持云服务和自托管部署。

DocsGPT - 一个结合检索增强生成(RAG)和多模型的开源企业文档代理平台

云原生
云原生 · 2025-11-26T12:10:00Z
GraphSearch - 一种图中心的检索增强生成工作流,用于深度搜索…

GraphSearch是一个图中心的检索增强生成工作流,结合图构建、检索和生成推理,支持多跳检索和问答,适用于复杂实体关系的数据。

GraphSearch - 一种图中心的检索增强生成工作流,用于深度搜索…

云原生
云原生 · 2025-11-26T12:00:00Z
如何通过知识图谱解决5个常见的检索增强生成(RAG)系统失效问题

标准的检索增强生成(RAG)系统在处理复杂问题时常常失效,无法保持上下文关系。本文提出了一种基于知识图谱的解决方案,通过明确的节点和边存储数据,增强系统推理能力,有效应对多步推理、歧义消解和矛盾信息,提高知识系统的可靠性。

如何通过知识图谱解决5个常见的检索增强生成(RAG)系统失效问题

freeCodeCamp.org
freeCodeCamp.org · 2025-11-13T15:20:24Z

9.15-9.19 AI 论文推荐

AI 论文周报丨强化学习/树结构框架/图谱检索增强生成新范式……一文速览多领域最新成果

HyperAI超神经
HyperAI超神经 · 2025-09-19T09:34:27Z

本研究提出了ClimateGPT Faithful+模型,旨在提升大型语言模型在气候文献检索生成中的忠实性,从30%提高至57%。

倾听上下文:朝着忠实的大型语言模型在气候问题上的检索增强生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-21T00:00:00Z

本研究提出了一种新方法,解决大型语言模型的幻觉和过时知识问题,分析超参数对检索增强生成(RAG)系统的影响,发现最佳超参数组合能提高响应速度并保持高检索准确性,为临床决策支持等应用提供重要参考。

优化检索增强生成:超参数对性能和效率的影响分析

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-13T00:00:00Z

本文介绍了ChemRAG-Bench基准测试工具,用于评估检索增强生成(RAG)在化学领域的有效性。研究结果显示,RAG的性能平均提升了17.4%,为未来应用提供了建议。

化学领域的检索增强生成基准测试

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-12T00:00:00Z

本研究针对当前多模态大语言模型在艺术作品分析中未能有效捕捉细腻解读的问题,提出了一种新颖的框架ArtRAG。该框架通过构建艺术上下文知识图谱,从多角度提供文化和历史背景,使模型能够生成更具语境和文化涵养的艺术描述,并在多个基准测试中超越传统的方法。

ArtRAG:基于结构化上下文的检索增强生成用于视觉艺术理解

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-09T00:00:00Z

本研究解决了科学文献快速增长带来的信息处理瓶颈,包括重复努力和跨学科合作的限制。提出的HiPerRAG系统通过高性能计算实现了对360万篇科学文章的高效检索和知识索引,采用了高通量文档解析模型Oreo和对比学习的编码算法ColTrast,显著提高了检索准确性。HiPerRAG在科学问答基准测试中表现优越,推动了科学知识的整合和学科间的创新。

HiPerRAG:高性能检索增强生成技术用于科学洞察

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-07T00:00:00Z

本研究解决了现有自适应检索方法依赖大语言模型而导致的效率低下和实用性不强的问题。我们提出了一种基于外部信息的轻量级自适应检索方法,并在多个问答数据集上进行评估,结果显示该方法在保持与复杂模型相当的性能的同时,实现了显著的效率提升,展现了外部信息在自适应检索中的潜力。

独立于大语言模型的自适应检索增强生成:让问题本身发声

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-07T00:00:00Z

本研究提出了一种新的实时空间检索增强生成(RAG)架构,旨在解决城市应用中基础模型知识更新缓慢和成本高的问题。该架构已在马德里旅游助手中成功验证,展现了其在智能城市解决方案中的潜力。

城市环境中的实时空间检索增强生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-04T00:00:00Z

本研究提出了EnronQA基准,包含103,638封电子邮件和528,304个问答对,解决了RAG基准缺乏个人上下文的问题,提高了企业对客户隐私文件的理解和使用效率。

EnronQA:面向私人文档的个性化检索增强生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-01T00:00:00Z

本研究提出了计划-执行-审查(PAR RAG)框架,以解决多跳问答中的推理路径偏差和结果错误传播问题,显著提升了准确性和可靠性,实验结果优于现有方法。

基于可信计划驱动的多跳问答检索增强生成方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-23T00:00:00Z

本研究解决了大语言模型在复杂任务中推理链的生成可靠性低和自然语言推理链干扰推理逻辑的主要问题。提出的新框架CoT-RAG通过知识图谱驱动的推理链生成、可学习的知识案例感知检索增强生成和伪程序提示执行,显著提升了推理准确性,且在多个数据集上表现出强大的实际应用价值和可扩展性。

CoT-RAG: 将思维链和检索增强生成整合以提升大语言模型的推理能力

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-18T00:00:00Z

该研究提出了RAMDocs数据集和MADAM-RAG方法,旨在解决语言模型在模糊查询和信息冲突中的挑战,有效抑制错误信息的产生。

带有冲突证据的检索增强生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-17T00:00:00Z

本研究提出CDF-RAG框架,针对现有检索增强生成(RAG)在因果关系识别中的不足,通过优化查询和多跳推理,提升了因果一致性和准确性。实验结果表明,该框架在多个数据集上有效提高了响应的准确性和因果正确性。

因果动态反馈的自适应检索增强生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-17T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码