小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

In this article, author Aaditya Chauhan discusses the limitations of RAG pipelines based purely on vector search and how an internal omni-search application using Reciprocal Rank Fusion (RRF) that...

Article: Why Vector Search Alone Isn't Enough: Hybrid Retrieval for RAG

InfoQ
InfoQ · 2026-06-02T09:00:00Z
简单易懂的RAG解析与实际项目

RAG(检索增强生成)是一种架构,解决了传统大型语言模型无法访问私有数据的问题。它通过从数据库中检索相关信息来增强用户问题,并生成基于这些信息的答案。RAG的工作流程包括文档分块、嵌入、向量数据库和提示增强,确保AI能准确回答用户问题。理解RAG对软件工程师至关重要,因为现代企业软件几乎都涉及这一技术。

简单易懂的RAG解析与实际项目

freeCodeCamp.org
freeCodeCamp.org · 2026-05-28T16:17:22Z
使用LangChain和向量数据库构建生产级RAG系统

本文介绍了一门课程,帮助用户从简单原型过渡到生产级RAG系统。课程内容涵盖文档处理、向量数据库优化、调试和安全性等方面,学习者将掌握构建稳健、安全的AI应用程序所需的技能。课程包括环境设置、RAG系统构建、混合搜索、观察性和安全层设置等。

使用LangChain和向量数据库构建生产级RAG系统

freeCodeCamp.org
freeCodeCamp.org · 2026-05-28T12:52:22Z
ApexAnalytica如何在单一Postgres实例上运行建筑遥测、事务数据和RAG

ApexAnalytica是由Andrew McKenna开发的建筑智能平台,利用TimescaleDB显著提升数据分析速度,将12个月的小时热图查询时间从6秒缩短至1秒。该平台整合建筑管理系统的实时数据,提供实时分析和故障检测,支持多种协议,服务于多个行业客户。

ApexAnalytica如何在单一Postgres实例上运行建筑遥测、事务数据和RAG

Timescale Blog
Timescale Blog · 2026-05-27T12:47:00Z
在RAG中实现混合语义-词汇搜索

本文介绍了在RAG系统中实现混合语义-词汇搜索的方法,结合BM25词汇搜索与语义搜索,通过互惠排名融合(RRF)进行整合。混合搜索策略有效提升了检索效果,提供了Python实现的详细步骤,包括库的安装、数据集加载、BM25和语义搜索的独立执行及结果融合。通过示例查询,展示了混合搜索的优势。

在RAG中实现混合语义-词汇搜索

MachineLearningMastery.com
MachineLearningMastery.com · 2026-05-25T12:00:35Z
EP216:RAG与代理的区别

本文讨论了RAG(检索增强生成)与代理的区别。RAG通过检索相关文档生成答案,适用于文档中有答案的情况;而代理在推理循环中使用工具,适合需要在其他系统上执行操作的任务。文章还介绍了Claude Code的课程和请求处理流程,以及前向代理、反向代理和API网关的功能与区别。

EP216:RAG与代理的区别

ByteByteGo Newsletter
ByteByteGo Newsletter · 2026-05-23T15:31:18Z
Antony Pegg:从托管PostgreSQL到生产RAG:在pgEdge云中构建您自己的Ellie

pgEdge推出的RAG服务器可实现24x7监控和管理Postgres数据库,支持检索增强生成。用户通过API发送查询,系统结合向量相似性和BM25关键词匹配,提供准确答案。RAG服务器可作为托管服务部署,支持多种嵌入和完成提供商,简化文档检索和管理流程,适用于合规和客户支持需求。

Antony Pegg:从托管PostgreSQL到生产RAG:在pgEdge云中构建您自己的Ellie

Planet PostgreSQL
Planet PostgreSQL · 2026-05-21T12:27:22Z
为什么生产环境中的RAG系统在大规模时会给出自信但错误的答案

在生产环境中,RAG系统的主要瓶颈是检索,而非模型本身。随着数据量增加,检索质量下降,导致模型生成不准确的答案。有效的检索架构应结合混合检索、早期过滤和多阶段排名,以确保高召回率和低延迟。检索质量直接影响系统性能,需整体优化。

为什么生产环境中的RAG系统在大规模时会给出自信但错误的答案

The New Stack
The New Stack · 2026-05-19T14:00:00Z
AI 开发狂飙!.NET 11 Preview 4 原生集成向量搜索 + MCP 模板,EF Core 直接对标 RAG 应用

微软在.NET 11 Preview 4中强调向量搜索是AI开发的核心,结合EF Core和MCP Server模板,提升了语义检索和API调用的标准化。EF Core支持向量搜索,简化了AI应用开发,MCP为AI模型提供统一的工具调用接口。这些进展使.NET开发者能够更高效地构建AI应用。

AI 开发狂飙!.NET 11 Preview 4 原生集成向量搜索 + MCP 模板,EF Core 直接对标 RAG 应用

dotNET跨平台
dotNET跨平台 · 2026-05-17T00:01:10Z
使用Microsoft GraphRAG分析《红楼梦》中人物和事件的关系

文章探讨了冯道的历史评价随时间变化的现象,并介绍了微软的GraphRAG技术,该技术利用AI分析《红楼梦》文本,通过构建知识图谱提取实体及其关系,帮助深入理解人物性格和家族关系。文章强调了AI在复杂问题上的应用潜力,认为GraphRAG能够挖掘更多历史和文学中的有趣信息。

使用Microsoft GraphRAG分析《红楼梦》中人物和事件的关系

dotNET跨平台
dotNET跨平台 · 2026-05-16T00:00:59Z

谷歌扩展了Gemini API的文件搜索功能,增强了多模态检索能力。新功能支持图像与文本混合检索、自定义元数据过滤和页面级引用,提高了AI在企业知识库和文档问答中的准确性。开发者可直接使用Gemini API,无需复杂的向量数据库,适合构建企业级知识助手和客服机器人。

谷歌宣布扩展Gemini API中的文件搜索功能 为开发者带来更完整的多模态RAG能力

蓝点网
蓝点网 · 2026-05-11T01:56:38Z

Rbatis与Turso结合在Rust生态中构建AI Agent和RAG应用。Rbatis是高性能ORM,支持多种数据库,Turso是重写的SQLite,具备原生向量搜索能力。两者结合实现高效文档存储与检索,支持AI助手从知识库获取信息并生成回答,提升智能应用的性能与准确性。

Rbatis + Turso:在 Rust 生态中构建 AI Agent 与 RAG 应用

Rust.cc
Rust.cc · 2026-05-10T07:07:27Z
将RAG推向主流的公司如今正对其下注

Pinecone宣布RAG时代结束,推出Nexus知识引擎,强调推理过程的上游转变。Nexus将源数据预编译为特定任务的结构化文档,提升任务完成率并降低成本,改变开发者的工作方式。

将RAG推向主流的公司如今正对其下注

The New Stack
The New Stack · 2026-05-06T14:40:50Z
RAG重排序解析:更好的上下文,更好的答案

RAG重排序是提升检索增强生成系统准确性和可靠性的关键。通过重新排序检索到的文档,确保语言模型获得相关信息,减少错误回答。重排序通过评估文档与用户查询的匹配度来优化结果。结合双编码器和交叉编码器的混合方法可以提高效率和准确性。Meilisearch是构建RAG系统的理想工具,提供快速检索和高质量结果。

RAG重排序解析:更好的上下文,更好的答案

meilisearch blog
meilisearch blog · 2026-05-05T00:00:00Z

Traditional

Agentic RAG Explained in 3 Levels of Difficulty

MachineLearningMastery.com
MachineLearningMastery.com · 2026-05-04T12:00:34Z

爱马仕搭建了个人知识管理RAG检索系统,通过自然语言查询提高笔记检索准确性。该系统利用Markdown笔记库、向量化脚本和ChromaDB进行数据存储与查询,解决了传统知识管理中的文件分类和标签混乱问题。经过45天的使用,知识查找时间显著减少,旧笔记的发现频率增加,促进了笔记整理和知识串联。未来计划加入网页剪藏和多模型embedding,以提升系统智能化水平。

Hermes(爱马仕):搭建个人知识管理RAG检索

远飞闲记
远飞闲记 · 2026-04-28T15:30:00Z
Hermes(爱马仕):搭建个人知识管理RAG检索

本文介绍了Hermes个人知识管理系统的设计与实现,旨在通过自然语言查询快速检索笔记。该系统采用向量化技术和ChromaDB存储,解决了传统知识管理方法中的文件分类和标签混乱问题。经过45天的使用,知识查找效率显著提升,用户对旧笔记的使用频率增加,写作效率也有所提高。未来计划增加网页剪藏和多模型支持,以进一步提升系统智能化水平。

Hermes(爱马仕):搭建个人知识管理RAG检索

远飞闲记
远飞闲记 · 2026-04-28T15:30:00Z
RAG如何在客户支持中提升大规模准确性

RAG(检索增强生成)系统通过访问外部知识库,为客户支持提供准确及时的答案,减少AI生成的错误信息,提升客户体验,降低工单数量,使AI助手在处理常见问题时更高效。其实施有助于企业优化客户服务,确保信息更新,提升客户满意度。

RAG如何在客户支持中提升大规模准确性

meilisearch blog
meilisearch blog · 2026-04-28T00:00:00Z
如何构建一个具有知识反思的自学习RAG系统

本文讨论了RAG系统的缺陷,提出通过知识反思层来解决学习和记忆的问题。该层在文档摄取后自动寻找相关文档并进行综合分析,从而提升知识库的智能。教程详细介绍了构建反思管道的步骤,包括设置基础系统、更新架构和创建反思引擎。最终,系统能够提供更有价值的综合信息,而不仅仅是原始文档片段。

如何构建一个具有知识反思的自学习RAG系统

freeCodeCamp.org
freeCodeCamp.org · 2026-04-24T20:52:49Z
一文吃透Ollama Embeddings:概念、实操、避坑,助力RAG落地|本地部署AI大模型必备

本文介绍了Ollama中的嵌入向量及其在检索增强生成中的应用。嵌入向量将文本转换为数值数组,以便计算语义相似度。文章探讨了嵌入向量的生成方法、应用场景(如搜索引擎、去重、推荐系统)以及常见问题和解决方案,帮助新手理解和应用该技术。

一文吃透Ollama Embeddings:概念、实操、避坑,助力RAG落地|本地部署AI大模型必备

人言兑
人言兑 · 2026-04-24T10:40:15Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码