小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

RAG(检索增强生成)是解决大语言模型(LLM)结构性缺陷的关键。它通过知识解耦和外部存储检索,降低幻觉率,实现知识快速更新,确保私有数据安全并提供可追溯性。RAG系统包括离线ETL和在线查询,涉及文档解析、清洗、切片、嵌入和检索等环节,高质量的文档解析和有效的检索策略是其成功的基础。

【大模型基础设施工程】17:RAG 工程全景

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-22T00:00:00Z
开源GBrain:读写循环、结构化知识与混合检索实现持续改进的记忆系统

GBrain是一个持续进化的AI认知系统,通过结构化知识库和自动循环机制,实现长期记忆和信息积累。它将生活数据转化为可检索的知识,解决了普通AI缺乏长期记忆的问题。系统通过混合检索和定期更新,确保信息的准确性和可控性,形成一个不断增强的认知网络。用户可以直接修改数据,保持对AI的控制权。

开源GBrain:读写循环、结构化知识与混合检索实现持续改进的记忆系统

极道
极道 · 2026-04-13T01:08:00Z
让大模型多模态检索全面超越SOTA!ReCALL框架化解生成式与判别式的范式冲突|CVPR’26

ReCALL框架通过“诊断-生成-校准”闭环解决了多模态大模型在检索中的范式冲突,提升了细粒度推理能力,显著提高了组合图像检索的性能,标志着大模型向下游任务迁移的新阶段。

让大模型多模态检索全面超越SOTA!ReCALL框架化解生成式与判别式的范式冲突|CVPR’26

量子位
量子位 · 2026-04-06T15:30:59Z
Salesforce AI 研究院发布 VoiceAgentRAG:一款双代理内存路由器,可将语音 RAG 检索延迟降低 316 倍

Salesforce AI团队推出了VoiceAgentRAG,采用双代理架构,通过快速响应者和慢思考者解决语音AI延迟问题。该系统检索速度提升至316倍,缓存命中率达到75%,在主题连贯对话中可达95%。

Salesforce AI 研究院发布 VoiceAgentRAG:一款双代理内存路由器,可将语音 RAG 检索延迟降低 316 倍

实时互动网
实时互动网 · 2026-03-31T03:00:28Z
向量嵌入生成器:工作原理及使用方法

向量嵌入生成器将文本、图像或代码等原始输入转换为数值向量,使相似概念聚集在一起,从而实现基于意义的检索,如聊天机器人和推荐引擎。选择合适的生成器对检索质量和基础设施成本至关重要。生成器通常基于变换器架构,能够捕捉上下文和意义。在评估生成器时,需要考虑模型选择、部署方式及其与实际数据的匹配程度。Redis提供快速的向量搜索和混合检索,适合生产环境。

向量嵌入生成器:工作原理及使用方法

Redis Blog
Redis Blog · 2026-03-31T00:00:00Z
AMES:近似多模态企业搜索通过晚期交互检索

AMES(近似多模态企业搜索)是一种支持文本、图像和视频跨模态检索的统一架构。它采用两阶段管道,结合并行搜索和优化重排序,展示了高效的检索性能,尤其在可扩展的Solr系统中表现出色。

AMES:近似多模态企业搜索通过晚期交互检索

Apple Machine Learning Research
Apple Machine Learning Research · 2026-03-17T00:00:00Z
Qdrant与谷歌Gemini嵌入2的结合

谷歌推出Gemini Embedding 2,这是首个全面支持文本、图像、视频、音频和PDF的多模态嵌入模型,能够直接处理各类模态,避免信息损失,并支持灵活的输出维度。Qdrant数据库与之完美适配,简化了不同模态嵌入的存储与检索过程。该技术可应用于多模态检索、跨模态语义搜索和统一内容推荐等领域。

Qdrant与谷歌Gemini嵌入2的结合

Qdrant - Vector Database
Qdrant - Vector Database · 2026-03-10T00:00:00Z
向量数据库的应用案例及如何选择合适的数据库

向量数据库通过语义匹配而非关键词查找数据,改变了AI应用的构建方式。它存储高维数值表示,利用数学相似性进行检索,常用于检索增强生成、语义搜索和推荐系统。适合需要语义理解和高并发的场景,能够快速处理复杂查询。

向量数据库的应用案例及如何选择合适的数据库

Redis Blog
Redis Blog · 2026-03-04T00:00:00Z
RAG指标:如何衡量和优化你的检索管道

用户询问重置密码时,聊天机器人能快速提供正确答案,但询问退款政策时却返回不相关信息。RAG指标用于识别问题,优化架构和度量标准。检索质量、生成准确性和系统可靠性是关键,选择合适的指标应基于架构设计,以确保在生产环境中平衡质量、成本和速度。

RAG指标:如何衡量和优化你的检索管道

Redis Blog
Redis Blog · 2026-03-03T00:00:00Z
蒙纳发布全新字体检索与探索工具AI Search

蒙纳推出AI Search字体检索工具,支持多语言操作,用户可通过自然语言描述需求,精准匹配超过25万款字体,显著提升工作效率。调研显示,62%的企业认为AI提升了效率,85%的创作者认为独特字体对品牌个性至关重要。

蒙纳发布全新字体检索与探索工具AI Search

全球TMT-美通国际
全球TMT-美通国际 · 2026-03-02T02:12:51Z
企业响应中的检索增强生成:如何通过检索架构建立人工智能信任

大型语言模型(LLM)的表现依赖于输入上下文,缺乏实时企业数据可能导致错误回答。检索增强生成(RAG)通过在回答前检索相关信息,结合语言模型与外部知识库,确保回答基于最新的上下文,从而提升企业的信任度和响应质量。

企业响应中的检索增强生成:如何通过检索架构建立人工智能信任

Redis Blog
Redis Blog · 2026-03-01T00:00:00Z
适用于您的RAG管道的五大嵌入模型

在检索增强生成(RAG)管道中,嵌入模型是检索的基础。本文评估了多种英语和多语言嵌入模型,依据性能、下载量和实用性进行排名。前五名模型为BAAI bge-m3、Qwen3-Embedding-8B、Snowflake Arctic Embed L v2.0、Jina Embeddings V3和GTE Multilingual Base,适用于多种数据类型和领域的检索需求。

适用于您的RAG管道的五大嵌入模型

KDnuggets
KDnuggets · 2026-02-12T13:00:28Z
简化Vercel Sandbox环境中的文件检索

Vercel Sandbox SDK新增downloadFile()和readFileToBuffer()两个方法,简化文件检索,用户可轻松下载报告或读取文件内容,无需手动处理流。

简化Vercel Sandbox环境中的文件检索

Vercel News
Vercel News · 2026-02-06T13:00:00Z
Dify 1.12.0 摘要索引:从碎片化检索到完整上下文

知识库问答中的用户问题分为具体查询和总结请求。传统块检索对具体查询有效,但总结效果差。Dify 1.12.0引入的Summary Index通过为每个块添加摘要字段,改善了总结查询的效果。

Dify 1.12.0 摘要索引:从碎片化检索到完整上下文

Dify AI
Dify AI · 2026-02-05T00:00:00Z
voyage-multimodal-3.5:具有视频支持的新一代多模态检索前沿

我们推出了voyage-multimodal-3.5,这是一个新一代多模态嵌入模型,支持文本、图像和视频检索。该模型在检索准确性上优于Cohere Embed v4和Google Multimodal Embedding 001,特别是在文本搜索中表现突出。它通过统一的变换器编码器处理视觉和文本信息,并支持视频帧嵌入,提升了检索质量。

voyage-multimodal-3.5:具有视频支持的新一代多模态检索前沿

Voyage AI
Voyage AI · 2026-01-15T14:50:00Z
Vercel开源用于通过本地文件系统进行上下文检索的Bash工具

Vercel开源了一款bash工具,允许AI代理执行文件系统命令以获取上下文。该工具支持执行bash脚本、读取和更新文件,旨在减少语言模型的上下文窗口并高效提取文件信息。开发者可在Vercel的AI SDK中使用此工具,提升AI代理的文件操作能力。

Vercel开源用于通过本地文件系统进行上下文检索的Bash工具

InfoQ
InfoQ · 2026-01-14T10:56:00Z
如何评估RAG系统:指标、框架与基础设施

RAG系统在演示中表现良好,但在生产中常出现无关答案和虚假信息。本文介绍了评估RAG系统检索和生成性能的方法,包括自动化评估框架和生产实践,以便在用户之前捕捉失败。评估维度包括上下文相关性、真实性和答案相关性,确保系统能够有效检索和生成准确答案。

如何评估RAG系统:指标、框架与基础设施

Redis Blog
Redis Blog · 2026-01-13T00:00:00Z
MiroThinker - 一个支持工具增强推理的开源搜索代理,适用于超长文档的检索

MiroThinker是一个开源的研究级搜索代理,支持工具增强推理和深度信息检索,具备256K的上下文处理能力,适用于学术研究和长文档问答,主要用Python实现,提供多种工具集成和部署选项。

MiroThinker - 一个支持工具增强推理的开源搜索代理,适用于超长文档的检索

云原生
云原生 · 2026-01-11T12:48:43Z
开源检索基础设施可以弥补AI的生产差距

大型模型在早期受到关注,但企业工程团队面临挑战,模型规模的追求忽视了检索瓶颈,导致AI项目仍处于原型阶段。检索增强生成(RAG)通过真实数据提高准确性,解决了AI系统的幻觉问题。企业应重视检索基础设施,采用开源数据库以实现灵活定制,确保数据治理和透明度。RAG的普及为AI提供了可靠基础,推动企业向生产级AI系统发展。

开源检索基础设施可以弥补AI的生产差距

The New Stack
The New Stack · 2026-01-09T18:00:08Z
知识库现已支持多模态检索

Dify知识库现已支持多模态能力,文本与图像可共同理解和利用。系统自动提取图像并与文本向量化存储,用户可通过自然语言或上传图像快速检索信息。这一进展使图像成为可计算的知识,推动企业文档处理的边界。

知识库现已支持多模态检索

Dify AI
Dify AI · 2026-01-07T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码