小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

谷歌扩展了Gemini API的文件搜索功能,增强了多模态检索能力。新功能支持图像与文本混合检索、自定义元数据过滤和页面级引用,提高了AI在企业知识库和文档问答中的准确性。开发者可直接使用Gemini API,无需复杂的向量数据库,适合构建企业级知识助手和客服机器人。

谷歌宣布扩展Gemini API中的文件搜索功能 为开发者带来更完整的多模态RAG能力

蓝点网
蓝点网 · 2026-05-11T01:56:38Z

Rbatis与Turso结合在Rust生态中构建AI Agent和RAG应用。Rbatis是高性能ORM,支持多种数据库,Turso是重写的SQLite,具备原生向量搜索能力。两者结合实现高效文档存储与检索,支持AI助手从知识库获取信息并生成回答,提升智能应用的性能与准确性。

Rbatis + Turso:在 Rust 生态中构建 AI Agent 与 RAG 应用

Rust.cc
Rust.cc · 2026-05-10T07:07:27Z
将RAG推向主流的公司如今正对其下注

Pinecone宣布RAG时代结束,推出Nexus知识引擎,强调推理过程的上游转变。Nexus将源数据预编译为特定任务的结构化文档,提升任务完成率并降低成本,改变开发者的工作方式。

将RAG推向主流的公司如今正对其下注

The New Stack
The New Stack · 2026-05-06T14:40:50Z
RAG重排序解析:更好的上下文,更好的答案

RAG重排序是提升检索增强生成系统准确性和可靠性的关键。通过重新排序检索到的文档,确保语言模型获得相关信息,减少错误回答。重排序通过评估文档与用户查询的匹配度来优化结果。结合双编码器和交叉编码器的混合方法可以提高效率和准确性。Meilisearch是构建RAG系统的理想工具,提供快速检索和高质量结果。

RAG重排序解析:更好的上下文,更好的答案

meilisearch blog
meilisearch blog · 2026-05-05T00:00:00Z

Traditional

Agentic RAG Explained in 3 Levels of Difficulty

MachineLearningMastery.com
MachineLearningMastery.com · 2026-05-04T12:00:34Z
Hermes(爱马仕):搭建个人知识管理RAG检索

本文介绍了Hermes个人知识管理系统的设计与实现,旨在通过自然语言查询快速检索笔记。该系统采用向量化技术和ChromaDB存储,解决了传统知识管理方法中的文件分类和标签混乱问题。经过45天的使用,知识查找效率显著提升,用户对旧笔记的使用频率增加,写作效率也有所提高。未来计划增加网页剪藏和多模型支持,以进一步提升系统智能化水平。

Hermes(爱马仕):搭建个人知识管理RAG检索

远飞闲记
远飞闲记 · 2026-04-28T15:30:00Z

爱马仕搭建了个人知识管理RAG检索系统,通过自然语言查询提高笔记检索准确性。该系统利用Markdown笔记库、向量化脚本和ChromaDB进行数据存储与查询,解决了传统知识管理中的文件分类和标签混乱问题。经过45天的使用,知识查找时间显著减少,旧笔记的发现频率增加,促进了笔记整理和知识串联。未来计划加入网页剪藏和多模型embedding,以提升系统智能化水平。

Hermes(爱马仕):搭建个人知识管理RAG检索

远飞闲记
远飞闲记 · 2026-04-28T15:30:00Z
RAG如何在客户支持中提升大规模准确性

RAG(检索增强生成)系统通过访问外部知识库,为客户支持提供准确及时的答案,减少AI生成的错误信息,提升客户体验,降低工单数量,使AI助手在处理常见问题时更高效。其实施有助于企业优化客户服务,确保信息更新,提升客户满意度。

RAG如何在客户支持中提升大规模准确性

meilisearch blog
meilisearch blog · 2026-04-28T00:00:00Z
如何构建一个具有知识反思的自学习RAG系统

本文讨论了RAG系统的缺陷,提出通过知识反思层来解决学习和记忆的问题。该层在文档摄取后自动寻找相关文档并进行综合分析,从而提升知识库的智能。教程详细介绍了构建反思管道的步骤,包括设置基础系统、更新架构和创建反思引擎。最终,系统能够提供更有价值的综合信息,而不仅仅是原始文档片段。

如何构建一个具有知识反思的自学习RAG系统

freeCodeCamp.org
freeCodeCamp.org · 2026-04-24T20:52:49Z
一文吃透Ollama Embeddings:概念、实操、避坑,助力RAG落地|本地部署AI大模型必备

本文介绍了Ollama中的嵌入向量及其在检索增强生成中的应用。嵌入向量将文本转换为数值数组,以便计算语义相似度。文章探讨了嵌入向量的生成方法、应用场景(如搜索引擎、去重、推荐系统)以及常见问题和解决方案,帮助新手理解和应用该技术。

一文吃透Ollama Embeddings:概念、实操、避坑,助力RAG落地|本地部署AI大模型必备

人言兑
人言兑 · 2026-04-24T10:40:15Z
一分钟读论文:《MASS-RAG:多智能体协同的检索增强生成》

论文《MASS-RAG: Multi-Agent Synthesis Retrieval-Augmented Generation》提出了一种多智能体协同处理检索证据的方法,旨在提高在噪声和异构上下文下的答案准确性。该方法将证据处理分为四个阶段,由不同智能体完成,显著降低了幻觉率并增强了鲁棒性,适用于多种场景。

一分钟读论文:《MASS-RAG:多智能体协同的检索增强生成》

Micropaper
Micropaper · 2026-04-22T00:00:00Z

本文探讨了大模型基础设施的演变,涵盖训练、推理、RAG和Agent等技术,介绍了适合工程师的新技术栈及其应用,包括开源和商业解决方案。

大模型基础设施工程

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-22T00:00:00Z

本文探讨了RAG(检索增强生成)中的存储与检索层,重点介绍向量索引算法的选择和量化方法,以及2024-2026年工业界的趋势。文章分为四部分:算法底层、产品选型、工程实操和图RAG与趋势,提供实用的参数和代码示例。向量检索主要使用近似最近邻(ANN)算法,推荐HNSW作为工业标准,并结合量化技术以降低内存占用。最后,GraphRAG结合知识图谱与向量检索,提升多跳推理能力。

【大模型基础设施工程】18:向量库与图 RAG

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-22T00:00:00Z

RAG(检索增强生成)是解决大语言模型(LLM)结构性缺陷的关键。它通过知识解耦和外部存储检索,降低幻觉率,实现知识快速更新,确保私有数据安全并提供可追溯性。RAG系统包括离线ETL和在线查询,涉及文档解析、清洗、切片、嵌入和检索等环节,高质量的文档解析和有效的检索策略是其成功的基础。

【大模型基础设施工程】17:RAG 工程全景

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-22T00:00:00Z
Data Graphs如何构建真正的混合图RAG平台

Data Graphs是一家英国公司,提供结合图数据库、全文搜索和向量嵌入的知识图谱服务。其平台通过Qdrant实现混合检索,克服了仅依赖向量检索的局限性,支持复杂数据的高效检索。经过18个月的生产运行,Qdrant表现稳定,未来将向机器优先的方向发展。

Data Graphs如何构建真正的混合图RAG平台

Qdrant - Vector Database
Qdrant - Vector Database · 2026-04-22T00:00:00Z

本文探讨了大模型基础设施的必要性与发展历程,强调大模型的特点,如计算和内存密集、状态重、故障常态化及高成本。系列文章将涵盖从硬件到应用的五层模型,帮助工程师理解大模型的工程化过程及其挑战。未来的工程创新将是降低成本的关键,推理侧的重要性将超过训练侧。

【大模型基础设施工程】01:大模型基础设施全景 —— 训练、推理、RAG、Agent、观测

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-22T00:00:00Z

RAG模型在处理查询时效率低下,无法有效整合知识。Karpathy提出的LLM Wiki通过预编译知识,创建结构化的维基,解决了这一问题。该方法在文档摄取时进行编译,更新知识库,避免信息丢失,适用于个人知识管理和长期研究,能持续积累和综合知识,提升信息的组织性和可用性。

从RAG到知识编译

Finisky Garden
Finisky Garden · 2026-04-16T03:43:00Z

文章讨论了RAG(检索增强生成)模型的效率问题,提出Karpathy的LLM Wiki概念,强调知识应在入库时进行结构化编译,而非临时检索。LLM Wiki通过生成摘要和更新相关页面,持续维护知识库,降低维护成本,适合个人知识管理和长期研究。尽管RAG有其应用场景,但LLM Wiki在深度理解和知识积累方面更具优势。

从RAG到知识编译

Finisky Garden
Finisky Garden · 2026-04-16T00:39:28Z
Ahsan Hadi:pgEdge Vectorizer和RAG服务器:将语义搜索引入PostgreSQL(第二部分)

pgEdge推出了一个新的AI工具包,旨在简化在PostgreSQL上构建AI驱动的搜索应用。pgEdge Vectorizer作为后台进程,自动监控数据变化,生成嵌入并保持搜索索引同步,消除了手动维护的需求。pgEdge RAG Server提供简单的HTTP API,结合向量相似性和关键词匹配,生成基于实际数据的准确回答,使得在PostgreSQL上实现语义搜索变得高效且易于管理。

Ahsan Hadi:pgEdge Vectorizer和RAG服务器:将语义搜索引入PostgreSQL(第二部分)

Planet PostgreSQL
Planet PostgreSQL · 2026-04-15T06:29:33Z
RAG中的分块:策略、权衡与常见错误

本文讨论了在检索增强生成(RAG)管道中,文档分块的重要性。分块策略影响检索精度、索引大小和查询延迟。常见的分块方法包括固定大小分块、递归分块和语义分块。选择合适的分块策略需考虑文档类型和查询模式。较小的分块适合精确检索,而较大的分块则有助于叙述性查询。

RAG中的分块:策略、权衡与常见错误

Redis Blog
Redis Blog · 2026-04-13T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码