小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
沉浸式翻译 immersive translate
扩展人类判断:Dropbox如何利用大型语言模型提升RAG系统的标注效率

Dropbox通过结合人类标注和大型语言模型(LLMs)生成的标签,提升了文档检索的相关性和标注效率。尽管LLM存在局限性,但人类校准显著改善了RAG系统的性能。

扩展人类判断:Dropbox如何利用大型语言模型提升RAG系统的标注效率

InfoQ
InfoQ · 2026-03-07T18:00:00Z
向量数据库与图形RAG在智能体记忆中的应用:何时使用哪种

马修·梅奥拥有计算机科学硕士学位和数据挖掘研究生文凭,担任KDnuggets和Statology主编,致力于简化复杂的数据科学概念。他的研究兴趣包括自然语言处理、机器学习算法和新兴人工智能。

向量数据库与图形RAG在智能体记忆中的应用:何时使用哪种

MachineLearningMastery.com
MachineLearningMastery.com · 2026-03-05T11:00:32Z
RAG指标:如何衡量和优化你的检索管道

用户询问重置密码时,聊天机器人能快速提供正确答案,但询问退款政策时却返回不相关信息。RAG指标用于识别问题,优化架构和度量标准。检索质量、生成准确性和系统可靠性是关键,选择合适的指标应基于架构设计,以确保在生产环境中平衡质量、成本和速度。

RAG指标:如何衡量和优化你的检索管道

Redis Blog
Redis Blog · 2026-03-03T00:00:00Z

Your LLM is only as good as the context you feed it. Without grounding in real, current enterprise data, even the most capable language models produce responses that sound confident but miss the...

RAG for enterprise response: how retrieval architecture builds AI trust

Redis Blog
Redis Blog · 2026-03-01T00:00:00Z
RAG与SKILL、MCP与RLM的比较

使用SKILL进行自主工作流程,LLM可访问多种工具,但加载所有工具定义会导致上下文窗口膨胀或模型混淆,适合将数学或确定性路由转移到简单脚本中。

RAG与SKILL、MCP与RLM的比较

Alex Ewerlöf Notes
Alex Ewerlöf Notes · 2026-02-25T21:08:33Z
如何在AWS上构建一个可缩放至零的无服务器RAG管道

本教程介绍如何在AWS上部署一个完全无服务器的RAG管道,处理文档、图像、视频和音频。该管道在无人使用时可缩放至零,成本低至每月2-3美元,用户数据始终保留在自己的基础设施中。

如何在AWS上构建一个可缩放至零的无服务器RAG管道

freeCodeCamp.org
freeCodeCamp.org · 2026-02-25T14:55:56Z

Key takeaways Retrieval augmented generation (RAG) improves AI accuracy by grounding LLM outputs in verified, domain-specific context rather than relying on static training data alone. Start...

10 techniques to improve RAG accuracy

Redis Blog
Redis Blog · 2026-02-25T00:00:00Z

Vector search gets all the hype in AI circles. But if your retrieval augmented generation (RAG) app can't find a document when a user types an exact product SKU, a legal clause number, or a...

Full-text search for RAG: the precision layer vector search doesn't reliably replace

Redis Blog
Redis Blog · 2026-02-23T00:00:00Z
戴夫·佩奇:构建Ask Ellie:一个由pgEdge驱动的RAG聊天机器人

pgEdge推出了AI助手Ellie,利用PostgreSQL和pgEdge工具,结合检索增强生成(RAG)技术,快速提供文档答案。系统通过pgEdge Docloader加载文档,使用Vectorizer生成向量嵌入,RAG服务器负责检索与生成,确保安全性和实时响应,展示了PostgreSQL的强大能力。

戴夫·佩奇:构建Ask Ellie:一个由pgEdge驱动的RAG聊天机器人

Planet PostgreSQL
Planet PostgreSQL · 2026-02-19T07:59:55Z
EP202:MCP与RAG与AI代理

理查德·索彻和布莱恩·麦肯发布了35个2026年预测,指出LLM革命已结束,资本回归基础研究。传统编码将在12月消失,AI将负责编写代码,人类则负责管理。MCP、RAG和AI代理分别解决不同问题,MCP标准化工具使用,RAG提升答案质量,AI代理执行任务。

EP202:MCP与RAG与AI代理

ByteByteGo Newsletter
ByteByteGo Newsletter · 2026-02-14T16:30:21Z
您的RAG系统可能对图像视而不见,但它不必如此

多模态RAG系统结合文本与视觉信息,提升数据处理能力,打破数据孤岛,改善用户体验,减少错误。广泛应用于电商、制造和医疗等领域,支持统一向量空间和混合搜索,实现高效检索。

您的RAG系统可能对图像视而不见,但它不必如此

The New Stack
The New Stack · 2026-02-12T20:00:00Z
适用于您的RAG管道的五大嵌入模型

在检索增强生成(RAG)管道中,嵌入模型是检索的基础。本文评估了多种英语和多语言嵌入模型,依据性能、下载量和实用性进行排名。前五名模型为BAAI bge-m3、Qwen3-Embedding-8B、Snowflake Arctic Embed L v2.0、Jina Embeddings V3和GTE Multilingual Base,适用于多种数据类型和领域的检索需求。

适用于您的RAG管道的五大嵌入模型

KDnuggets
KDnuggets · 2026-02-12T13:00:28Z
DEVONthink Agent: a CLI tool with RAG-enhanced search

DEVONthink Agent 是一款命令行工具,结合关键词匹配与 RAG 技术,支持自然语言搜索和数据库内容分析。它通过三阶段工作流生成结构化研究报告,适用于多语言环境。该工具只读且安全性高,但仍处于实验阶段,使用时需谨慎。

DEVONthink Agent: a CLI tool with RAG-enhanced search

Another Dayu
Another Dayu · 2026-02-09T22:13:00Z

适用版本:【DWS 9.1.1.200(及以上)】在信息爆炸的时代,行业调研报告的生成正面临数据规模庞大、信息碎片化、人工处理效率低等多重挑战。检索增强生成(RAG, Retrieval-Augmented...

基于DWS构建RAG框架生成行业调研报告

华为云官方博客
华为云官方博客 · 2026-02-09T10:16:07Z
AI大模型RAG项目实战课-Java版本[完结无密]

请在购买前仔细阅读须知,虚拟商品一经购买不支持退换,介意者请勿购买。

AI大模型RAG项目实战课-Java版本[完结无密]

浅时光博客
浅时光博客 · 2026-02-07T09:13:45Z

面向 Live Data / 实时增量计算 场景,支持用同一套 pipeline 将数据接入、解析、更新与下游应用联动,适配构建可长期运行的实时数据管线与 RAG 工作流,具备完善的工程化能力与生态扩展性,适合在生产环境中持续处理不断变化的文档与数据源。,实现文本与版面结构的高效识别与标准化输出,并在文档更新时自动触发解析与结果同步,使实时数据链路中的索引与 RAG...

Pathway × PaddleOCR:握手知名开源框架,打通“动态文档”到实时 RAG 的数据入口

百度大脑
百度大脑 · 2026-02-06T13:25:55Z
RAG与大上下文窗口:AI应用的真实权衡

RAG(检索增强生成)和大上下文窗口各自解决不同问题,结合使用更为高效。RAG通过外部数据减少模型幻觉、更新知识并提供专业性,而大上下文窗口适合处理完整文档。两者在速度、成本和质量上存在权衡,选择应基于查询类型、数据量和延迟需求。混合架构可优化生产AI系统。

RAG与大上下文窗口:AI应用的真实权衡

Redis Blog
Redis Blog · 2026-02-06T00:00:00Z

依托文档转换、检索增强、索引构建、模型推理、多数据源连接器等核心能力,Haystack 大幅降低了构建高可靠性 AI 系统的技术门槛,使从独立开发者到大型组织都能够以更可控、可扩展的方式使用大模型,并通过其统一的组件化能力体系,为 AI 应用带来更加稳定、透明、可治理的生产级执行路径。截至2026年2月,输出的 Document 格式数据不仅包含解析后的文本内容,还可保留文件路径、页码等...

Haystack × PaddleOCR:海外开源伙伴+1!构建面向 RAG 与 Agent 的统一文档解析入口

百度大脑
百度大脑 · 2026-02-04T13:10:46Z
提示工程与检索增强生成(RAG)与微调:为何这不是一条简单的阶梯

大语言模型(LLM)的定制应综合考虑提示工程、检索增强生成(RAG)和微调等不同方法,关注数据隐私、延迟、控制程度、更新频率、部署目标和成本六个维度。成功的架构需在这些维度之间取得平衡,确保系统在实际环境中有效运行,而非单纯依赖最新技术。

提示工程与检索增强生成(RAG)与微调:为何这不是一条简单的阶梯

The New Stack
The New Stack · 2026-01-29T18:00:51Z
如何使用Next.js、Supabase和OpenAI构建一个AI驱动的RAG搜索应用

本教程指导如何从零开始构建一个完整的RAG搜索应用,支持用户上传PDF、DOCX和TXT文档,并通过AI进行语义搜索。应用功能包括文档存储、生成嵌入、基于文档内容的AI回答及文档管理。

如何使用Next.js、Supabase和OpenAI构建一个AI驱动的RAG搜索应用

freeCodeCamp.org
freeCodeCamp.org · 2026-01-27T17:21:37Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码