小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
如何使用RAG、ChromaDB和记忆构建一个AI驱动的私人文档搜索应用

文章讨论了如何使用LangChain和ChromaDB构建基于大语言模型的问答应用,重点在于处理非结构化数据,利用向量数据库进行信息存储和检索。通过数据加载、分块和相似性排名等步骤,开发者可以创建具有记忆功能的复杂应用,提高信息检索的准确性和效率。

如何使用RAG、ChromaDB和记忆构建一个AI驱动的私人文档搜索应用

The New Stack
The New Stack · 2026-04-10T16:00:00Z

In this article, the author explores how hierarchical agentic RAG systems coordinate specialized workers through structured orchestration to improve accuracy, reliability, and explainability in...

Article: Building Hierarchical Agentic RAG Systems: Multi-Modal Reasoning with Autonomous Error Recovery

InfoQ
InfoQ · 2026-04-09T09:00:00Z
提高检索增强生成(RAG)结果的五种重排序模型

本文介绍了五种重排序模型,以提高检索增强生成(RAG)系统的结果相关性。重排序在RAG流程中至关重要,通过评估候选项的相关性来优化最终答案。推荐的模型包括Qwen3-Reranker-4B、NVIDIA nv-rerankqa-mistral-4b-v3、Cohere rerank-v4.0-pro、jina-reranker-v3和BAAI bge-reranker-v2-m3。选择合适的重排序器时需考虑数据、延迟和成本等因素。

提高检索增强生成(RAG)结果的五种重排序模型

MachineLearningMastery.com
MachineLearningMastery.com · 2026-04-06T12:00:52Z
导致RAG管道崩溃的笔记本电脑归还

文章讨论了RAG(检索增强生成)管道中的问题,特别是如何通过结合向量相似性和结构化SQL来提高检索准确性。作者指出,语义相似性与事实正确性不同,强调了检索准确性存在差距。提出三种查询模式以解决文档过时和权限隔离问题,并建议将向量和结构化数据存储在同一数据库中,以简化操作和提高一致性。

导致RAG管道崩溃的笔记本电脑归还

The New Stack
The New Stack · 2026-04-03T11:00:00Z

Claude Code的RAG机制与传统RAG不同,它采用动态检索策略,无需离线索引。其四层检索架构逐步注入上下文,提升了检索的灵活性和精确度。通过多轮循环检索,Claude Code优化了搜索过程,克服了传统RAG的固定策略限制。

剖析Claude Code的RAG机制

Finisky Garden
Finisky Garden · 2026-04-02T15:54:23Z

Claude Code 的 RAG 机制采用动态检索策略,无需离线索引。模型根据上下文自主决定搜索内容和次数,分为四层检索架构,提升了检索的灵活性和精准度。通过子 Agent 和结果裁剪,优化了上下文管理,显著提高了效率。

拆解 Claude Code 的 RAG 机制

Finisky Garden
Finisky Garden · 2026-04-02T15:51:07Z

This article introduces Context-Augmented Generation (CAG) as an architectural refinement of RAG for enterprise systems. It shows how a Spring Boot-based context manager can incorporate user...

Article: Beyond RAG: Architecting Context-Aware AI Systems with Spring Boot

InfoQ
InfoQ · 2026-04-02T09:00:00Z
混合搜索的优势:为什么您的RAG系统需要关键词搜索和向量搜索

混合搜索结合了BM25和向量检索,克服了纯向量和关键词搜索的不足,提升了检索准确性,适用于技术文档及法律医疗领域。通过双路径处理,优化查询结果,降低LLM成本,提高上下文质量。Redis支持混合搜索,简化操作,适合构建RAG系统和智能代理。

混合搜索的优势:为什么您的RAG系统需要关键词搜索和向量搜索

Redis Blog
Redis Blog · 2026-04-01T00:00:00Z
Salesforce AI 研究院发布 VoiceAgentRAG:一款双代理内存路由器,可将语音 RAG 检索延迟降低 316 倍

Salesforce AI团队推出了VoiceAgentRAG,采用双代理架构,通过快速响应者和慢思考者解决语音AI延迟问题。该系统检索速度提升至316倍,缓存命中率达到75%,在主题连贯对话中可达95%。

Salesforce AI 研究院发布 VoiceAgentRAG:一款双代理内存路由器,可将语音 RAG 检索延迟降低 316 倍

实时互动网
实时互动网 · 2026-03-31T03:00:28Z
从RAG到多智能体涌现:构建AI知识系统的完整方法论与实践路径解析

本文探讨了构建AI知识系统的四层结构,强调知识组织与标签体系的重要性,提出通过信息管道、本地记忆、自动进化和智能体碰撞实现智能体的自我学习与进化,从而提升人类在认知框架设计中的核心地位。

从RAG到多智能体涌现:构建AI知识系统的完整方法论与实践路径解析

极道
极道 · 2026-03-24T00:39:00Z
如何构建和优化AI中的RAG以获得可靠的答案

RAG(检索增强生成)结合信息检索与文本生成,通过外部数据源获取信息,生成准确响应,减少AI幻觉,提升生成质量,适用于客服聊天机器人等。构建RAG系统需关注数据、检索与生成,确保信息相关性和安全性,Meilisearch可优化检索过程,提升系统可靠性。

如何构建和优化AI中的RAG以获得可靠的答案

meilisearch blog
meilisearch blog · 2026-03-24T00:00:00Z
How Agentic RAG Works?

Agentic RAG通过引入决策循环,解决了标准RAG在处理复杂查询时的不足。它在生成答案前评估检索结果的质量,进行查询优化和多源检索,从而提高准确性,但可能导致延迟和成本增加,需谨慎选择使用。

How Agentic RAG Works?

ByteByteGo Newsletter
ByteByteGo Newsletter · 2026-03-23T15:31:43Z
AI Agent 与 RAG 技术深度解析:从理论到实践

AI Agent 和 RAG 技术是当前 AI 领域的热门方向。AI Agent 具备自主感知、决策和执行能力,适用于自动化办公和代码开发等场景。RAG 技术通过检索外部知识库,增强模型的实时知识更新和准确性。两者结合可提升智能系统的推理和决策能力,推动 AI 应用的发展。

AI Agent 与 RAG 技术深度解析:从理论到实践

远飞闲记
远飞闲记 · 2026-03-19T00:00:00Z
如何使用Cloudflare Workers构建生产级RAG系统 - 开发者手册

本文介绍了如何在Cloudflare上构建高效的RAG(检索增强生成)系统。该系统利用Workers AI和Vectorize实现低成本的自然语言处理,支持快速查询和准确回答。教程包括项目设置、数据管道构建、查询管道实现及错误处理,最终实现一个可部署的API,成本仅为每月5美元。

如何使用Cloudflare Workers构建生产级RAG系统 - 开发者手册

freeCodeCamp.org
freeCodeCamp.org · 2026-03-18T23:05:13Z
伊布拉尔·艾哈迈德:在SQL引擎中实现具有事务性内存和一致性保证的RAG

大多数RAG系统仅适用于静态文档搜索,无法处理多代理同时写入,导致内存不一致和错误答案。PostgreSQL通过事务性内存管理解决了这些问题,确保数据一致性和可追溯性,适合动态知识更新。

伊布拉尔·艾哈迈德:在SQL引擎中实现具有事务性内存和一致性保证的RAG

Planet PostgreSQL
Planet PostgreSQL · 2026-03-18T06:04:00Z
如何交付一个生产就绪的检索增强生成(RAG)应用程序,使用FAISS(安全防护、评估和后备机制)

本文介绍了构建适合生产环境的检索增强生成(RAG)应用程序的方法,重点解决检索不准确、缺乏可见性和系统脆弱性等问题。教程涵盖使用FastAPI、FAISS向量存储和安全防护措施的系统架构,以确保模型在真实用户环境中的稳定运行,并通过设置检索门和后备机制提升应用的可靠性和用户体验。

如何交付一个生产就绪的检索增强生成(RAG)应用程序,使用FAISS(安全防护、评估和后备机制)

freeCodeCamp.org
freeCodeCamp.org · 2026-03-16T17:43:51Z

文章介绍了pgEdge AI工具的使用,重点讲解了如何通过文档转换、向量化和检索增强生成(RAG)构建AI聊天系统。作者分享了在本地运行整个流程的经验,包括文档向量化、相似性搜索和响应生成。pgEdge工具使AI学习变得简单易懂,适合基础设施和数据库工程师。

Richard Yen:使用pgEdge的RAG快速学习AI

Planet PostgreSQL
Planet PostgreSQL · 2026-03-16T08:00:00Z
如何在AWS上构建一个可扩展至零的无服务器RAG管道

本教程介绍如何在AWS上部署无服务器的RAG管道,处理文档、图像、视频和音频,确保无人使用时成本为零。通过RAGStack-Lambda,用户可上传文件,自动提取元数据并生成嵌入,最终通过AI聊天界面查询知识库,月成本仅为2-3美元。

如何在AWS上构建一个可扩展至零的无服务器RAG管道

freeCodeCamp.org
freeCodeCamp.org · 2026-03-11T18:19:40Z
扩展人类判断:Dropbox如何利用大型语言模型提升RAG系统的标注效率

Dropbox通过结合人类标注和大型语言模型(LLMs)生成的标签,提升了文档检索的相关性和标注效率。尽管LLM存在局限性,但人类校准显著改善了RAG系统的性能。

扩展人类判断:Dropbox如何利用大型语言模型提升RAG系统的标注效率

InfoQ
InfoQ · 2026-03-07T18:00:00Z
向量数据库与图形RAG在智能体记忆中的应用:何时使用哪种

向量数据库适合处理非结构化数据,能快速检索相似信息,但在多步逻辑推理上存在局限。图形RAG通过知识图谱实现精确的关系检索,适合复杂推理和结构化问题。未来,混合架构将结合两者的优势,以满足更高的推理需求。

向量数据库与图形RAG在智能体记忆中的应用:何时使用哪种

MachineLearningMastery.com
MachineLearningMastery.com · 2026-03-05T11:00:32Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码