小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
导致RAG管道崩溃的笔记本电脑归还

文章讨论了RAG(检索增强生成)管道中的问题,特别是如何通过结合向量相似性和结构化SQL来提高检索准确性。作者指出,语义相似性与事实正确性不同,强调了检索准确性存在差距。提出三种查询模式以解决文档过时和权限隔离问题,并建议将向量和结构化数据存储在同一数据库中,以简化操作和提高一致性。

导致RAG管道崩溃的笔记本电脑归还

The New Stack
The New Stack · 2026-04-03T11:00:00Z
混合搜索的优势:为什么您的RAG系统需要关键词搜索和向量搜索

混合搜索结合了BM25和向量检索,克服了纯向量和关键词搜索的不足,提升了检索准确性,适用于技术文档及法律医疗领域。通过双路径处理,优化查询结果,降低LLM成本,提高上下文质量。Redis支持混合搜索,简化操作,适合构建RAG系统和智能代理。

混合搜索的优势:为什么您的RAG系统需要关键词搜索和向量搜索

Redis Blog
Redis Blog · 2026-04-01T00:00:00Z
Mosaic AI向量搜索中的重排序:提升RAG代理的快速智能检索

许多组织在构建AI代理时面临的主要挑战是上下文而非模型。Mosaic AI的重排序功能提高了检索准确性,平均提升15个百分点,确保代理获取最相关的数据,从而提升回答的质量和一致性,适用于高质量的RAG代理系统。用户通过简单的参数设置即可快速实现高质量检索,显著改善代理性能。

Mosaic AI向量搜索中的重排序:提升RAG代理的快速智能检索

Databricks
Databricks · 2025-08-18T19:30:00Z
rerank-2.5和rerank-2.5-lite:指令跟随重排序器

新推出的rerank-2.5系列显著提升了检索准确性,支持32K令牌上下文长度和指令跟随功能,准确性较Cohere Rerank v3.5提高7.94%。用户可通过自然语言指令优化模型输出。

rerank-2.5和rerank-2.5-lite:指令跟随重排序器

MongoDB
MongoDB · 2025-08-11T12:00:00Z
rerank-2.5 和 rerank-2.5-lite:指令跟随重排序器

我们推出了rerank-2.5系列,显著提升检索准确性,并首次引入指令跟随功能。该系列在93个数据集上比Cohere Rerank v3.5提高约8%。新功能支持用户通过自然语言调整模型输出的相关性评分,适用于32K令牌上下文长度,便于处理更长文档的检索。

rerank-2.5 和 rerank-2.5-lite:指令跟随重排序器

Voyage AI
Voyage AI · 2025-08-11T07:00:00Z
介绍 voyage-context-3:全球文档上下文下的聚焦块级细节

我们推出了voyage-context-3模型,通过上下文化的块嵌入提升文档检索的准确性。在块级和文档级检索任务中,分别比OpenAI-v3-large和Cohere-v4提高了14.24%和12.56%。该模型简化了技术堆栈,降低了存储成本,支持多维度和量化选项,适用于长文档和高敏感度检索任务。

介绍 voyage-context-3:全球文档上下文下的聚焦块级细节

Voyage AI
Voyage AI · 2025-07-23T12:40:17Z
超越基础RAG:使用RAGAS测量嵌入和生成性能

本文探讨了检索增强生成(RAG)系统的评估方法,强调评估对生成质量和检索准确性的重要性。通过RAGAS框架,文章测量了检索性能和生成质量,并比较了不同模型的结果,指出开源模型在准确性方面具有竞争力。未来将继续优化评估过程,探索多种检索和生成策略。

超越基础RAG:使用RAGAS测量嵌入和生成性能

DEV Community
DEV Community · 2025-04-12T14:33:03Z
深度搜索/深度研究实施实用指南

DeepSearch在2025年成为新的搜索标准,通过深度搜索和推理提高检索准确性。主要公司如谷歌和OpenAI推出相关产品,用户愿意接受更长的处理时间以获得高质量结果。DeepSearch通过迭代搜索、阅读和推理,解决复杂查询,推动搜索行业变革。

深度搜索/深度研究实施实用指南

Jina AI
Jina AI · 2025-02-25T13:36:17Z
通过知识图谱提升AI数据管理的能力

WhyHow.AI与MongoDB结合,创建了一个开源平台,优化知识图谱的数据管理与洞察。该平台通过图结构提升检索准确性,支持灵活查询与扩展,适用于多种数据集,助力企业在AI领域的发展。

通过知识图谱提升AI数据管理的能力

MongoDB
MongoDB · 2025-02-13T20:26:50Z

本研究提出KIMAs系统,旨在解决知识密集型应用在异构数据处理、对话管理和低延迟响应方面的不足,从而提高检索准确性和对话连贯性,支持大规模应用的可靠部署。

Configurable Knowledge Integration Multi-Agent System

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-13T00:00:00Z
使用 Sentrev 寻找合适的嵌入模型

Sentrev是一个Python库,旨在简化嵌入模型的评估,帮助用户选择适合文本数据的最佳模型。它支持多种文档格式,提供检索准确性指标和性能分析,并与Qdrant和FastEmbed集成,未来计划扩展到多模态检索。选择合适的嵌入模型对提高检索效率至关重要。

使用 Sentrev 寻找合适的嵌入模型

Qdrant - Vector Database
Qdrant - Vector Database · 2025-01-31T03:40:24Z
寻找最佳的开源嵌入模型用于检索增强生成(RAG)

开放源代码的嵌入模型提供了成本效益和可定制性,用户可在本地运行,避免依赖第三方API。尽管评估这些模型复杂且耗时,但使用Ollama和pgai Vectorizer可以简化流程。评估结果表明,bge-m3模型在检索准确性方面表现最佳,适合处理上下文丰富的查询。选择模型时需考虑问题类型、资源和生成速度。

寻找最佳的开源嵌入模型用于检索增强生成(RAG)

Timescale Blog
Timescale Blog · 2024-12-19T14:00:44Z

本文提出了一种基于大型语言模型的生成聚类方法,通过KL散度定义相似性,并提出新颖的聚类算法。研究表明,该方法在聚类性能和文档检索准确性上显著提升。

信息论生成聚类文档

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-18T00:00:00Z
我们如何评估基于向量的代码检索?

现代代码检索系统依赖嵌入模型从大型代码库中检索相关代码片段。目前面临的问题包括评估质量的基准数据集不足、标签噪声和算法推理能力不足。Voyage AI收集社区反馈,探讨创建高质量评估基准的方法,利用问答数据集和代码库中的问题作为查询,以提高检索准确性。

我们如何评估基于向量的代码检索?

Voyage AI
Voyage AI · 2024-12-04T16:00:00Z
RAG检索性能提升实践:混合检索与自查询技术的详细解析

在检索增强生成(RAG)系统中,检索性能直接影响生成质量。本文探讨了混合检索和自查询检索两种优化技术,显著提升了检索的准确性和灵活性。混合检索结合多种算法并动态调整权重,自查询检索则自动分析用户查询以优化过滤条件。这些技术通过合理配置和优化,提升了RAG系统的整体性能和用户体验。

RAG检索性能提升实践:混合检索与自查询技术的详细解析

DEV Community
DEV Community · 2024-11-13T01:17:25Z

本文介绍了多种视频时刻检索模型的进展,包括Moment Alignment Network、交叉模态交互网络和跨模态相关性匹配模型。这些模型通过结合语言查询和视频内容,提高了检索准确性和定位精度。此外,研究还提出了去偏置网络和背景感知模型,进一步增强了视频与文本的对齐效果。

解耦与去噪:解决视频时刻检索中的上下文不对齐问题

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-14T00:00:00Z

本文提出了一种新的迭代 RAG 方法 ReSP,配备双功能摘要生成器,显著提升多跳问题回答的效果。同时开发了 MultiHop-RAG 数据集,揭示了现有 RAG 方法的不足,并探讨了 RAG 的发展范式及评估方法。新框架 RichRAG 和改进的 Multi-Meta-RAG 方法提高了多跳问题的检索准确性,推动了 RAG 技术的进步和应用。

高效检索:多跳问答的高效检索器

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-08T00:00:00Z
voyage-multilingual-2:多语言嵌入模型

文章介绍了新发布的voyage-multilingual-2模型,该模型专为多语言检索和增强生成优化。它在多种语言上的表现优于OpenAI v3和Cohere多语言v3,平均提升5.6%。该模型支持32K上下文长度,适用于代码、法律和金融等专业领域,能够提高检索准确性。

voyage-multilingual-2:多语言嵌入模型

Voyage AI
Voyage AI · 2024-06-11T00:34:08Z

本研究提出了三个新的跨模态检索基准,旨在提升文本与音频之间的检索效果。通过预训练音频任务,建立了文本-音频和音频-文本检索的基线,并公开了数据集和代码。研究表明,采用新框架和方法显著提高了检索准确性,推动了音频检索领域的发展。

音频 - 文本检索中的语言沟通

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-11T00:00:00Z

CLIP2Video是一种新的视频文本检索方法,通过将图像语言预训练模型转移到视频文本检索,提升了检索准确性。

增强图像检索:基于 CLIP 模型的照片搜索的全面研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-24T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码