小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
沉浸式翻译 immersive translate
学习RAG与MCP基础知识

构建AI不仅依赖于智能提示。freeCodeCamp.org的课程教授如何将模型与私有信息结合,利用RAG和MCP技术提升AI的能力与协调性。学习处理文档、存储向量,并构建MCP服务器以实现实际任务。

学习RAG与MCP基础知识

freeCodeCamp.org
freeCodeCamp.org · 2026-01-22T14:34:33Z

我们探索出的双RAG架构,其价值核心并非追求极致的简单或敏捷,而是它既能像资深的一线研发一样,深度理解业务及代码变更的具体语境与潜在影响,又能像严谨的架构师一样,严格遵循成文的规范与最佳实践。通过结构化的协同机制,系统将两种不同质、不同源的知识(深度的代码语义与精准的评审规则)进行融合,实现了 “1+1 > 2”...

基于知识工程&JoyAgent双RAG的智能代码评审系统的探索与实践

京东科技开发者
京东科技开发者 · 2026-01-21T09:47:30Z
如何构建生产就绪的AI代理:使用RAG和FastAPI

代理人工智能已从演示转向实际应用,如自主研究助手和合规副驾驶。确保代理的可靠性、安全性和成本意识至关重要。本文提供了构建和部署代理系统的实用蓝图,包括推理循环、RAG、保护措施和成本控制,以实现可靠的自主AI工作流。

如何构建生产就绪的AI代理:使用RAG和FastAPI

The New Stack
The New Stack · 2026-01-20T15:00:57Z

我们探索出的双RAG架构,其价值核心并非追求极致的简单或敏捷,而是它既能像资深的一线研发一样,深度理解业务及代码变更的具体语境与潜在影响,又能像严谨的架构师一样,严格遵循成文的规范与最佳实践。通过结构化的协同机制,系统将两种不同质、不同源的知识(深度的代码语义与精准的评审规则)进行融合,实现了 “1+1 > 2”...

基于知识工程&JoyAgent双RAG的智能代码评审系统的探索与实践

京东科技开发者
京东科技开发者 · 2026-01-15T06:17:59Z

Your Retrieval Augmented Generation (RAG) system works perfectly in demos, then production users report irrelevant answers and hallucinated facts. The retrieval finds documents, the LLM generates...

How to evaluate RAG systems: metrics, frameworks & infrastructure

Redis Blog
Redis Blog · 2026-01-13T00:00:00Z

Information comes in many shapes and forms. While retrieval-augmented generation (RAG) primarily focuses on plain text, it overlooks vast amounts of data along the way. Most enterprise knowledge...

Vision RAG: Enabling Search on Any Documents

MongoDB
MongoDB · 2026-01-12T16:00:00Z

目前LLM应用集中在开发所谓AI智能体,理想中的AI智能体能够自主感知环境并作出决策,与环境的变化不断反馈,同时具备记忆,反思和工具能力.而目前的AI应用中,效果最好,成本也低的还是RAG.

RAG系统设计

Sekyoro的博客小屋
Sekyoro的博客小屋 · 2026-01-12T15:50:19Z

大语言模型正从被动问答工具转变为自主智能体,代理式RAG架构通过上下文追踪和图谱解决复杂任务中的知识和记忆问题。引入代码分析和动态决策轨迹后,智能体能更有效地执行任务并学习历史经验。

Agentic RAG 的架构演进:从上下文追踪 (Context Trace) 到全景上下文图谱 (Context Graphs)

phodal
phodal · 2026-01-11T01:58:00Z
通过小型语言模型(SLM)和检索增强生成(RAG)构建更便宜、更安全、可审计的人工智能

企业结合小型语言模型(SLM)与检索增强生成(RAG)架构,能有效降低基础设施成本,提高响应准确性和可审计性。SLM专注于特定领域,适合企业平台的可持续运行,而RAG通过引用权威数据源增强输出可信度。模块化代理架构使每个代理独立负责特定功能,便于扩展、治理,确保合规性和操作控制。

通过小型语言模型(SLM)和检索增强生成(RAG)构建更便宜、更安全、可审计的人工智能

The New Stack
The New Stack · 2026-01-10T18:00:27Z

检索做大,生成做轻:CMU团队系统评测RAG的语料与模型权衡

机器之心
机器之心 · 2026-01-06T02:21:55Z
亚马逊S3 Vectors正式发布,引入“存储优先”架构用于RAG

AWS推出S3 Vectors,支持存储和查询向量数据,单个索引容量提升至20亿个向量,查询延迟低于100毫秒。目前已有超过25万个索引,处理超400亿个向量,服务覆盖14个区域,定价基于上传的向量逻辑GB和索引大小。

亚马逊S3 Vectors正式发布,引入“存储优先”架构用于RAG

InfoQ
InfoQ · 2026-01-02T10:17:00Z

我们将深入探讨“统一文档表示”(Unified Document Representation)如何解决非结构化数据处理的异构性难题,剖析 IngestionPipeline 在流式处理和错误恢复方面的设计智慧,评估基于 Microsoft.ML.Tokenizers 的语义分块策略对检索质量的深远影响,并详细阐述 Microsoft.Extensions.VectorData...

.NET 数据摄取与向量化架构:构建企业级检索增强生成(RAG)管道

dotNET跨平台
dotNET跨平台 · 2025-12-28T00:02:26Z
.NET 数据摄取与向量化架构:构建企业级检索增强生成(RAG)管道 - 张善友

随着生成式人工智能技术的发展,企业级应用开发正在转型。微软推出的 Microsoft.Extensions.DataIngestion 和 Microsoft.Extensions.VectorData 库,标志着从实验性 AI 开发向标准化数据管道的转变。这些库通过统一文档表示和模块化设计,简化了数据处理,提高了开发效率,推动了 AI 应用的智能化与灵活性。

.NET 数据摄取与向量化架构:构建企业级检索增强生成(RAG)管道 - 张善友

张善友
张善友 · 2025-12-27T02:52:00Z
RAG 教程笔记(Task04)

混合检索结合稀疏向量和密集向量,以提高检索准确性。稀疏向量基于词频,具有良好的可解释性,但缺乏语义理解;密集向量通过深度学习理解同义词,具备更强的泛化能力。查询构建利用大语言模型将自然语言转为结构化查询,支持多种数据类型。检索技术的进阶包括重排序、压缩和校正,以提升检索精度和答案质量。

RAG 教程笔记(Task04)

程序员充电站
程序员充电站 · 2025-12-25T08:55:29Z
RAG 教程笔记(Task03)

向量嵌入技术将复杂数据转化为低维向量,提升检索质量。多模态嵌入实现跨模态对齐,打破数据类型壁垒。向量数据库高效管理和查询高维向量,支持AI应用。Milvus是开源的分布式向量数据库,适合大规模相似性搜索,通过优化索引提升检索精确性与效率。

RAG 教程笔记(Task03)

程序员充电站
程序员充电站 · 2025-12-25T08:54:47Z
RAG 教程笔记(Task02)

当前主流的RAG文档加载器包括PyMuPDF、TextLoader和DirectoryLoader,适用于不同文档格式。文本分块是RAG流程的关键,分块策略包括固定大小、递归字符和语义分块,旨在提升信息检索的精度和处理效率。

RAG 教程笔记(Task02)

程序员充电站
程序员充电站 · 2025-12-19T15:05:29Z
戴夫·佩奇:RAG服务器与MCP服务器:为人工智能驱动的数据库访问选择合适的方法

随着人工智能的发展,RAG和MCP服务器在数据访问上存在不同的安全隐患。RAG服务器适合有明确查询模式的应用,而MCP服务器则支持灵活的数据分析,但面临数据泄露和提示注入攻击的风险,使用时需谨慎。

戴夫·佩奇:RAG服务器与MCP服务器:为人工智能驱动的数据库访问选择合适的方法

Planet PostgreSQL
Planet PostgreSQL · 2025-12-19T11:31:20Z

本案例利用Kotaemon框架和ModelArts Studio提供的DeepSeek-V3模型,构建一个高效、便捷、可定制的本地/私人知识库,方便开发者检索各种场景的文档,提高工作效率。

【案例共创】基于开发者空间使用Kotaemon开源RAG UI和华为云Maas搭建本地/私人AI知识库

华为云官方博客
华为云官方博客 · 2025-12-18T12:30:00Z
RAG的定位和未来 - 蝈蝈俊

到2025年,RAG技术经历了深刻的反思与演进,旨在弥补大模型固定知识与动态外部知识之间的差距。选择RAG、长上下文或文本检索需考虑成本、效果与可控性。未来,RAG将成为AI应用的核心数据基础设施,提供可追溯的答案,确保可信性与可控性。

RAG的定位和未来 - 蝈蝈俊

蝈蝈俊
蝈蝈俊 · 2025-12-18T10:48:00Z

Retrieval-Augmented Generation (RAG) has become central to how enterprises build AI systems. It allows LLMs to access and reason over proprietary enterprise data without expensive fine-tuning,...

Agentic RAG: How enterprises are surmounting the limits of traditional RAG

Redis Blog
Redis Blog · 2025-12-18T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码