小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
五种高效的长上下文检索增强生成技术

本文介绍了五种高效的长上下文检索增强生成(RAG)技术,旨在解决注意力限制和成本挑战。这些技术包括通过重新排序解决“中间丢失”问题、利用上下文缓存减少延迟和计算成本,以及结合元数据过滤和查询扩展提高相关性,从而构建可扩展且精准的RAG系统,确保模型关注最相关的信息。

五种高效的长上下文检索增强生成技术

MachineLearningMastery.com
MachineLearningMastery.com · 2026-04-15T12:00:40Z
检索增强生成即服务:概念、应用案例、提供商及更多

大型语言模型(LLMs)在信息不足时常出现错误回答。检索增强生成(RAG)通过连接外部数据来改善这一问题。RAG即服务(RAGaaS)为企业提供外部管理平台,使其无需深入了解向量数据库即可构建AI应用,简化数据接入、索引和检索过程,适用于客户支持聊天机器人和内部知识库等场景。选择自建RAG系统或使用RAGaaS取决于团队的专业知识和定制需求。

检索增强生成即服务:概念、应用案例、提供商及更多

meilisearch blog
meilisearch blog · 2026-04-07T00:00:00Z
提高检索增强生成(RAG)结果的五种重排序模型

本文介绍了五种重排序模型,以提高检索增强生成(RAG)系统的结果相关性。重排序在RAG流程中至关重要,通过评估候选项的相关性来优化最终答案。推荐的模型包括Qwen3-Reranker-4B、NVIDIA nv-rerankqa-mistral-4b-v3、Cohere rerank-v4.0-pro、jina-reranker-v3和BAAI bge-reranker-v2-m3。选择合适的重排序器时需考虑数据、延迟和成本等因素。

提高检索增强生成(RAG)结果的五种重排序模型

MachineLearningMastery.com
MachineLearningMastery.com · 2026-04-06T12:00:52Z

减少大型语言模型中的幻觉问题可以通过七种策略实现:1. 使用检索增强生成(RAG)确保回答基于可靠数据;2. 关键声明需引用来源;3. 使用工具调用而非自由回答;4. 添加生成后验证步骤;5. 偏向引用而非改写;6. 校准不确定性并优雅失败;7. 持续评估和监控。这些方法有助于提高系统的可靠性和准确性。

减少生产环境中大型语言模型幻觉的七种方法

KDnuggets
KDnuggets · 2026-03-18T12:00:21Z
企业响应中的检索增强生成:如何通过检索架构建立人工智能信任

大型语言模型(LLM)的表现依赖于输入上下文,缺乏实时企业数据可能导致错误回答。检索增强生成(RAG)通过在回答前检索相关信息,结合语言模型与外部知识库,确保回答基于最新的上下文,从而提升企业的信任度和响应质量。

企业响应中的检索增强生成:如何通过检索架构建立人工智能信任

Redis Blog
Redis Blog · 2026-03-01T00:00:00Z
利用大型语言模型增强人类标注,提高Dash搜索相关性

Dropbox Dash利用检索增强生成(RAG)模式,通过企业搜索获取相关信息并生成回答。它结合人类标注与大型语言模型(LLM)训练搜索排名模型,以提升搜索结果的相关性和质量。Dash通过自动化与人工审核相结合,确保生成的相关性标签准确且可扩展,从而优化搜索体验。

利用大型语言模型增强人类标注,提高Dash搜索相关性

Dropbox Tech Blog
Dropbox Tech Blog · 2026-02-26T17:00:00Z
通过检索增强生成和多目标对齐统一查询自动补全中的排名与生成

查询自动补全(QAC)是现代搜索系统的重要功能,但现有方法存在挑战。我们提出了一种统一框架,将QAC重构为端到端列表生成,结合检索增强生成(RAG)和多目标直接偏好优化(DPO),通过创新的多目标优化和混合服务架构,显著提升了搜索效率,并验证了其在生产中的有效性。

通过检索增强生成和多目标对齐统一查询自动补全中的排名与生成

Apple Machine Learning Research
Apple Machine Learning Research · 2026-02-18T00:00:00Z
提示工程与检索增强生成(RAG)与微调:为何这不是一条简单的阶梯

大语言模型(LLM)的定制应综合考虑提示工程、检索增强生成(RAG)和微调等不同方法,关注数据隐私、延迟、控制程度、更新频率、部署目标和成本六个维度。成功的架构需在这些维度之间取得平衡,确保系统在实际环境中有效运行,而非单纯依赖最新技术。

提示工程与检索增强生成(RAG)与微调:为何这不是一条简单的阶梯

The New Stack
The New Stack · 2026-01-29T18:00:51Z
如何使用检索增强生成与您的PDF进行对话

大型语言模型虽然能回答问题,但无法直接读取私密文档。检索增强生成(RAG)结合语言模型与用户数据,通过检索文档相关部分来提供答案。本文介绍如何使用LangChain构建后端和简单的React界面,实现与PDF的对话。RAG通过文档分块、生成向量嵌入并检索相关内容,确保答案基于真实数据,适用于处理公司政策和合同等文档。

如何使用检索增强生成与您的PDF进行对话

freeCodeCamp.org
freeCodeCamp.org · 2026-01-27T02:27:57Z
从统计学习到通用智能

文章探讨了人工智能的发展,特别是大语言模型(LLM)与向量数据库的结合。大模型通过深度学习和海量数据具备语言理解能力,能够处理复杂任务。检索增强生成(RAG)技术提升了模型的知识更新能力,而智能体(Agent)则赋予AI执行实际任务的能力。成功的关键在于问题的定义,而非仅仅掌握工具。

从统计学习到通用智能

Surmon.me
Surmon.me · 2026-01-18T16:04:04Z
通过小型语言模型(SLM)和检索增强生成(RAG)构建更便宜、更安全、可审计的人工智能

企业结合小型语言模型(SLM)与检索增强生成(RAG)架构,能有效降低基础设施成本,提高响应准确性和可审计性。SLM专注于特定领域,适合企业平台的可持续运行,而RAG通过引用权威数据源增强输出可信度。模块化代理架构使每个代理独立负责特定功能,便于扩展、治理,确保合规性和操作控制。

通过小型语言模型(SLM)和检索增强生成(RAG)构建更便宜、更安全、可审计的人工智能

The New Stack
The New Stack · 2026-01-10T18:00:27Z
开源检索基础设施可以弥补AI的生产差距

大型模型在早期受到关注,但企业工程团队面临挑战,模型规模的追求忽视了检索瓶颈,导致AI项目仍处于原型阶段。检索增强生成(RAG)通过真实数据提高准确性,解决了AI系统的幻觉问题。企业应重视检索基础设施,采用开源数据库以实现灵活定制,确保数据治理和透明度。RAG的普及为AI提供了可靠基础,推动企业向生产级AI系统发展。

开源检索基础设施可以弥补AI的生产差距

The New Stack
The New Stack · 2026-01-09T18:00:08Z
指令检索器:解锁搜索代理中的系统级推理

基础代理在企业应用中至关重要,但传统的检索增强生成(RAG)常常无法准确理解用户意图。为此,提出了“指令检索器”架构,能更有效地处理复杂查询,提升检索性能超过70%。该架构通过系统规范的传播,改善了指令遵循能力,适用于多步骤搜索代理,显著提高响应质量和任务完成效率。

指令检索器:解锁搜索代理中的系统级推理

Databricks
Databricks · 2026-01-06T20:00:57Z
测试时重用预训练数据是计算增益的倍增器

本文探讨了重用预训练数据在测试中的有效性。研究表明,通过检索增强生成和测试时计算,模型在MMLU、Math-500和SimpleQA等任务上的准确性显著提高。在MMLU上,预训练结合检索的方式实现了约5倍的计算增益,进一步的测试时计算可提升10个百分点。这表明当前预训练方法未充分利用现有数据集的信息,仍有改进空间。

测试时重用预训练数据是计算增益的倍增器

Apple Machine Learning Research
Apple Machine Learning Research · 2025-12-12T00:00:00Z
如何使用Amazon Lex、Bedrock和S3构建基于检索增强生成(RAG)的AI聊天机器人

本文介绍了如何构建一个基于检索增强生成(RAG)的AI聊天机器人,专门用于回答火星旅行政策的问题。通过使用Amazon S3存储旅行政策文档,聊天机器人能够从知识库中提取准确答案,而非依赖预训练数据。结合Amazon Lex和Bedrock,用户可以创建一个智能且上下文相关的聊天系统。

如何使用Amazon Lex、Bedrock和S3构建基于检索增强生成(RAG)的AI聊天机器人

freeCodeCamp.org
freeCodeCamp.org · 2025-12-03T22:34:26Z
DocsGPT - 一个结合检索增强生成(RAG)和多模型的开源企业文档代理平台

DocsGPT是一个开源文档代理平台,支持多种格式(如PDF、DOCX),结合检索增强生成(RAG)和大型语言模型,提供引用支持的答案。适用于企业文档搜索、内部知识助手和合规调查,支持云服务和自托管部署。

DocsGPT - 一个结合检索增强生成(RAG)和多模型的开源企业文档代理平台

云原生
云原生 · 2025-11-26T12:10:00Z
GraphSearch - 一种图中心的检索增强生成工作流,用于深度搜索…

GraphSearch是一个图中心的检索增强生成工作流,结合图构建、检索和生成推理,支持多跳检索和问答,适用于复杂实体关系的数据。

GraphSearch - 一种图中心的检索增强生成工作流,用于深度搜索…

云原生
云原生 · 2025-11-26T12:00:00Z
RAG 分块策略:从原理到实战优化,喂饭级教程不允许你踩坑

本文探讨了检索增强生成(RAG)中分块策略的重要性。分块是将大型文档分割成小片段以优化信息检索。主要分块策略包括固定大小、语义、递归和基于文档等,每种策略各有优缺点。选择合适的分块策略需考虑文档类型和任务需求,建议从512个tokens和10-15%的重叠率开始,以提高检索效果和信息组织性。

RAG 分块策略:从原理到实战优化,喂饭级教程不允许你踩坑

京东科技开发者
京东科技开发者 · 2025-11-26T09:05:01Z
RAG 分块策略:从原理到实战优化,喂饭级教程不允许你踩坑

本文探讨了在检索增强生成(RAG)中分块策略的重要性。分块是将大型文档分割成小片段以提高信息检索效率。主要分块策略包括固定大小分块、语义分块、递归分块和基于文档的分块。每种策略各有优缺点,选择合适的方法对提升RAG性能至关重要。建议从512个tokens和10-15%的重叠率开始,结合递归和语义分块进行优化。

RAG 分块策略:从原理到实战优化,喂饭级教程不允许你踩坑

京东科技开发者
京东科技开发者 · 2025-11-21T10:09:06Z
Pixeltable - 一种简化多模态AI工作负载的声明式数据基础设施

Pixeltable是一个开源的数据基础设施,支持多模态AI应用,提供统一的表接口以管理图像、视频、音频和文档。它支持数据处理、索引和检索,集成大语言模型和外部向量数据库,适用于检索增强生成(RAG)工作流,具备版本控制和可复现性。主要功能包括多模态表类型、声明式计算列、内置嵌入索引和语义搜索,适合多模态检索、自动标注和可复现的数据管道。

Pixeltable - 一种简化多模态AI工作负载的声明式数据基础设施

云原生
云原生 · 2025-11-20T15:51:56Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码