小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
知识图谱增强生成 (RAG):面向 AI 代理的结构化检索

Redis Iris 提供实时数据处理,支持向量搜索和知识图谱 RAG。知识图谱 RAG 通过建模实体及其关系,解决了传统向量搜索在多跳检索中的不足,确保信息的连贯性和准确性。Redis 的数据集成和内存管理功能确保数据的新鲜度和快速访问,适用于金融、电商和医疗等多个应用场景。

知识图谱增强生成 (RAG):面向 AI 代理的结构化检索

Redis Blog
Redis Blog · 2026-06-24T00:00:00Z
端到端的RAG工作流程:检索增强生成的工作原理

RAG(检索增强生成)是一种AI架构,通过连接大型语言模型与外部知识源,在推理时生成准确的上下文响应。RAG系统从外部数据库检索相关文档,并将其注入到LLM提示中,避免了模型每次知识更新时的重训练。其工作流程包括数据摄取、检索、提示设计和生成,强调检索组件的质量对输出结果的影响,高质量的知识库和检索器是确保生成准确答案的关键。

端到端的RAG工作流程:检索增强生成的工作原理

Databricks
Databricks · 2026-06-23T09:05:56Z
如何应对RAG系统中的小上下文窗口限制

检索增强生成(RAG)是一种通过检索相关材料并将其整合到模型提示中以提升回答质量的方法。文章探讨了RAG在小上下文窗口下的局限性,并提出通过文档摘要、块摘要和原始块的层次化索引来优化检索过程的解决方案。关键在于使用摘要进行检索,使用原始块进行回答,并通过上下文预算管理信息量,从而在资源有限的情况下提高RAG系统的可靠性和可调试性。

如何应对RAG系统中的小上下文窗口限制

freeCodeCamp.org
freeCodeCamp.org · 2026-06-18T00:09:31Z
[MAF预定义的AIContextProvider-01]TextSearchProvider——RAG在MAF中的实现 - Artech

ChatClientAgent通过输入增强和输出增强与大型语言模型(LLM)交互。检索增强生成(RAG)利用TextSearchProvider根据上下文检索相关信息,从而提升LLM的回答质量。文章示例展示了如何使用TextSearchProvider获取2026年斯诺克世锦赛冠军吴宜泽的信息,强调了RAG在解决LLM知识局限性中的重要性。

[MAF预定义的AIContextProvider-01]TextSearchProvider——RAG在MAF中的实现 - Artech

Artech
Artech · 2026-06-17T00:40:00Z
将Dify代理与真实数据结合:MongoDB Atlas和Voyage AI现已成为Dify RAG工作流的原生组件

Dify与MongoDB Atlas和Voyage AI的结合简化了AI应用开发流程。Dify提供可视化工作流,MongoDB Atlas负责数据存储与检索,Voyage AI提升检索精度。开发者和无代码构建者能够快速创建知识助手和项目管理代理等应用,提升AI应用的效率与准确性。

将Dify代理与真实数据结合:MongoDB Atlas和Voyage AI现已成为Dify RAG工作流的原生组件

Dify AI
Dify AI · 2026-06-17T00:00:00Z
RAG学习笔记

RAG(检索增强生成)分为离线和在线两个阶段。离线阶段包括文档解析、数据清洗和分块,在线阶段涉及用户提问、检索和生成回答。文档解析需兼容多种格式,数据清洗去除冗余信息,分块策略保持语义完整,向量化用于生成嵌入。检索阶段结合稠密和稀疏向量,重排序提升答案相关性。评估指标包括召回率、正确度和知识回答的准确性。

RAG学习笔记

TrumanDu 博客
TrumanDu 博客 · 2026-06-10T14:54:39Z

In this article, author Aaditya Chauhan discusses the limitations of RAG pipelines based purely on vector search and how an internal omni-search application using Reciprocal Rank Fusion (RRF) that...

Article: Why Vector Search Alone Isn't Enough: Hybrid Retrieval for RAG

InfoQ
InfoQ · 2026-06-02T09:00:00Z
简单易懂的RAG解析与实际项目

RAG(检索增强生成)是一种架构,解决了传统大型语言模型无法访问私有数据的问题。它通过从数据库中检索相关信息来增强用户问题,并生成基于这些信息的答案。RAG的工作流程包括文档分块、嵌入、向量数据库和提示增强,确保AI能准确回答用户问题。理解RAG对软件工程师至关重要,因为现代企业软件几乎都涉及这一技术。

简单易懂的RAG解析与实际项目

freeCodeCamp.org
freeCodeCamp.org · 2026-05-28T16:17:22Z
使用LangChain和向量数据库构建生产级RAG系统

本文介绍了一门课程,帮助用户从简单原型过渡到生产级RAG系统。课程内容涵盖文档处理、向量数据库优化、调试和安全性等方面,学习者将掌握构建稳健、安全的AI应用程序所需的技能。课程包括环境设置、RAG系统构建、混合搜索、观察性和安全层设置等。

使用LangChain和向量数据库构建生产级RAG系统

freeCodeCamp.org
freeCodeCamp.org · 2026-05-28T12:52:22Z
ApexAnalytica如何在单一Postgres实例上运行建筑遥测、事务数据和RAG

ApexAnalytica是由Andrew McKenna开发的建筑智能平台,利用TimescaleDB显著提升数据分析速度,将12个月的小时热图查询时间从6秒缩短至1秒。该平台整合建筑管理系统的实时数据,提供实时分析和故障检测,支持多种协议,服务于多个行业客户。

ApexAnalytica如何在单一Postgres实例上运行建筑遥测、事务数据和RAG

Timescale Blog
Timescale Blog · 2026-05-27T12:47:00Z
在RAG中实现混合语义-词汇搜索

本文介绍了在RAG系统中实现混合语义-词汇搜索的方法,结合BM25词汇搜索与语义搜索,通过互惠排名融合(RRF)进行整合。混合搜索策略有效提升了检索效果,提供了Python实现的详细步骤,包括库的安装、数据集加载、BM25和语义搜索的独立执行及结果融合。通过示例查询,展示了混合搜索的优势。

在RAG中实现混合语义-词汇搜索

MachineLearningMastery.com
MachineLearningMastery.com · 2026-05-25T12:00:35Z
EP216:RAG与代理的区别

本文讨论了RAG(检索增强生成)与代理的区别。RAG通过检索相关文档生成答案,适用于文档中有答案的情况;而代理在推理循环中使用工具,适合需要在其他系统上执行操作的任务。文章还介绍了Claude Code的课程和请求处理流程,以及前向代理、反向代理和API网关的功能与区别。

EP216:RAG与代理的区别

ByteByteGo Newsletter
ByteByteGo Newsletter · 2026-05-23T15:31:18Z
Antony Pegg:从托管PostgreSQL到生产RAG:在pgEdge云中构建您自己的Ellie

pgEdge推出的RAG服务器可实现24x7监控和管理Postgres数据库,支持检索增强生成。用户通过API发送查询,系统结合向量相似性和BM25关键词匹配,提供准确答案。RAG服务器可作为托管服务部署,支持多种嵌入和完成提供商,简化文档检索和管理流程,适用于合规和客户支持需求。

Antony Pegg:从托管PostgreSQL到生产RAG:在pgEdge云中构建您自己的Ellie

Planet PostgreSQL
Planet PostgreSQL · 2026-05-21T12:27:22Z
为什么生产环境中的RAG系统在大规模时会给出自信但错误的答案

在生产环境中,RAG系统的主要瓶颈是检索,而非模型本身。随着数据量增加,检索质量下降,导致模型生成不准确的答案。有效的检索架构应结合混合检索、早期过滤和多阶段排名,以确保高召回率和低延迟。检索质量直接影响系统性能,需整体优化。

为什么生产环境中的RAG系统在大规模时会给出自信但错误的答案

The New Stack
The New Stack · 2026-05-19T14:00:00Z
AI 开发狂飙!.NET 11 Preview 4 原生集成向量搜索 + MCP 模板,EF Core 直接对标 RAG 应用

微软在.NET 11 Preview 4中强调向量搜索是AI开发的核心,结合EF Core和MCP Server模板,提升了语义检索和API调用的标准化。EF Core支持向量搜索,简化了AI应用开发,MCP为AI模型提供统一的工具调用接口。这些进展使.NET开发者能够更高效地构建AI应用。

AI 开发狂飙!.NET 11 Preview 4 原生集成向量搜索 + MCP 模板,EF Core 直接对标 RAG 应用

dotNET跨平台
dotNET跨平台 · 2026-05-17T00:01:10Z
使用Microsoft GraphRAG分析《红楼梦》中人物和事件的关系

文章探讨了冯道的历史评价随时间变化的现象,并介绍了微软的GraphRAG技术,该技术利用AI分析《红楼梦》文本,通过构建知识图谱提取实体及其关系,帮助深入理解人物性格和家族关系。文章强调了AI在复杂问题上的应用潜力,认为GraphRAG能够挖掘更多历史和文学中的有趣信息。

使用Microsoft GraphRAG分析《红楼梦》中人物和事件的关系

dotNET跨平台
dotNET跨平台 · 2026-05-16T00:00:59Z

谷歌扩展了Gemini API的文件搜索功能,增强了多模态检索能力。新功能支持图像与文本混合检索、自定义元数据过滤和页面级引用,提高了AI在企业知识库和文档问答中的准确性。开发者可直接使用Gemini API,无需复杂的向量数据库,适合构建企业级知识助手和客服机器人。

谷歌宣布扩展Gemini API中的文件搜索功能 为开发者带来更完整的多模态RAG能力

蓝点网
蓝点网 · 2026-05-11T01:56:38Z

Rbatis与Turso结合在Rust生态中构建AI Agent和RAG应用。Rbatis是高性能ORM,支持多种数据库,Turso是重写的SQLite,具备原生向量搜索能力。两者结合实现高效文档存储与检索,支持AI助手从知识库获取信息并生成回答,提升智能应用的性能与准确性。

Rbatis + Turso:在 Rust 生态中构建 AI Agent 与 RAG 应用

Rust.cc
Rust.cc · 2026-05-10T07:07:27Z
将RAG推向主流的公司如今正对其下注

Pinecone宣布RAG时代结束,推出Nexus知识引擎,强调推理过程的上游转变。Nexus将源数据预编译为特定任务的结构化文档,提升任务完成率并降低成本,改变开发者的工作方式。

将RAG推向主流的公司如今正对其下注

The New Stack
The New Stack · 2026-05-06T14:40:50Z
RAG重排序解析:更好的上下文,更好的答案

RAG重排序是提升检索增强生成系统准确性和可靠性的关键。通过重新排序检索到的文档,确保语言模型获得相关信息,减少错误回答。重排序通过评估文档与用户查询的匹配度来优化结果。结合双编码器和交叉编码器的混合方法可以提高效率和准确性。Meilisearch是构建RAG系统的理想工具,提供快速检索和高质量结果。

RAG重排序解析:更好的上下文,更好的答案

meilisearch blog
meilisearch blog · 2026-05-05T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码